La presente raccolta di saggi (prevalentemente inediti, e tutti nati nell'ultimo quinquennio) presenta 
cinque prospettive sui diversi orizzonti della linguistica generale: dalle Americhe all'Oriente, dalla 
linguistica storica alla storia della linguistica, dal generativismo alla linguistica dei corpora. 
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Manuel Barbera è Ricercatore confermato alla Facoltà di Lingue dell'Università di Torino. Ha fatto 
parte di ricerche COFIN 1997, 1999 e 2001, PRIN 2002 e 2007, FIRB 2001 e Bando Regionale in 
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membro dell'Associazione per la storia della lingua italiana dal 2004. Si è occupato di linguistica 
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In copertina è un'immagine del Habronattus cuspidatus, un piccolo ma attivissimo saltacide che, 
come tutti i ragni saltatori, va famoso per i suoi otto occhi (quali i ragni in genere peraltro hanno) di 
notevole grandezza ed evidenza, grazie ai quali, tra l'altro, riesce invidiabilmente a guardarsi bene 
alle spalle (cfr. anche Michael F. Land - Dan-Eric Nilsson, Animai Eyes, Oxford - New York - età, 
Oxford University Press, 2002 "Oxford animai biology series", soprattutto pp. 95-99). 
Non sono purtroppo riuscito ad identificare l'autore dello scatto, e pertanto il mancato riconosci- 
mento della sua paternità e dei suoi diritti è indipendente dalla mia volontà, ma sono dispostissimo a 
farlo qualora ne fossi posto in grado. 
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I found myself agreeing with Goodman 's insistence that 
the world does not have a "ready-made " or "built-in " 
description; many descriptions may "fit", depending on 
our interests and purposes. (This does not mean that 
anything we happen to like "fìts". That more than one 
description may be right does not mean that every 
description is right, or that rightness is subjective). 

Hilary Putnam, A Half Century of Philosophy. Viewed 
from Within, in «Dedalus» CXXVI (1997) 1 198. 



Presentazione. 



I saggi qui opportunamente riuniti mostrano bene la caratteristica principale del loro Autore, una 
curiosità sorniona da gatto soriano che sembra dormire e invece guata il topo. Ampi sono gli 
orizzonti e lo sguardo, interessi antichi (quelli sul Voto, al quale Barbera ha dedicato un eccellente 
lavoro di dottorato) e mai sopiti (le lingue orientali e quelle amerinde) si affiancano a più recenti 
àmbiti di intervento (la linguistica dei corpora) in un insieme che fa andare il lettore sull'ottovolante. 
Ma non è una sensazione inquietante, perché Barbera affronta con garbo comunicativo i diversi 
problemi, pur sulla base di una documentazione ineccpibile. Il garbo si rivela al meglio nell'invito 
inespresso alla riflessione che l'Autore rivolge al lettore. 

Così, per limitarmi ad un esempio, nel caso della discussione sul Prete Gianni, tema affascinante 
e monumentale. È certo che i semi della leggenda sono ben più antichi del XII secolo, ma non basta 
rifarsi alla chiesa siriaca orientale nestoriana della Persia sassanide e al suo zelo missionario, poiché 
resta insolubile il problema degli Atti di Tommaso. D'accordo, è un testo apocrifo e certo non ante- 
riore, nella redazione a noi giunta, al V secolo, tuttavia la filologia ci invita a credere che esso pre- 
suppone un testo del II secolo, sempre siriaco (da Edessa? Nisibis?), altrettanto colorito e romanzato, 
dunque ben anteriore allo scisma nestoriano. Oltre tutto, le tradizioni indiane spesso prevedono un 
arrivo dell'Apostolo via mare, a Malankara nell'India meridionale, una delle sedi principali del 
commercio monsonico con l'Occidente e non c'è nulla di inverosimile in un arrivo di Ebrei cristia- 
nizzati con le navi romane. Si ricorderà infatti che da Quseir, sul Mar Rosso, partivano ogni 
settimana tre navi per l'India e inoltre che comunità israelitiche sono note anticamente nella 
medesima regione. Temi affascinanti, sui quali forse mai si potrà dire una parola definitiva (per ora 
cfh Robert Eric Frykenberg, History of Christianity in India, Oxford University Press, 2008 "Ox- 
ford History of the Christian Church"). 

Lodevole e pacato è il contributo sui rapporti tra linguistica generativa e linguistica dei corpora, 
del quale va apprezzato la volontà di dialogo scientifico, anche se ci si può legittimamente 
interrogare sul successo che un'iniziativa come questa può ottenere, poiché la linguistica generativa 
è per sua natura catafratta alla critica e alla discussione, almeno secondo il mio parere, e tuttavia è 
opportuno stimolare risposte e favorire incontri: nella galassia che è oggi la linguistica ognuno 
pensa di essere al centro e rischia di parlare di sé tra sé e sé, dunque bene ha fatto Barbera a tener 
aperte le porte del dialogo. 



Franco Crevatin 



Introduzione. 



I cinque saggi che qui si presentano coprono cinque anni di attività scientifica (anche se a volte 
con radici anteriori) e sono sostanzialmente inediti, vale a dire: il primo è completamente inedito; 
del secondo è solo presente un PDF nell'Archivio della Schweizerische Sprachwissenschaftliche 
Gesellschaft I Société Suisse de Linguistique (SSG/SSL); del terzo è stata pubblicata unicamente 
una versione abbreviata; del quarto la versione finora a stampa è in realtà inservibile perché lordata 
da inaccettabili errori editoriali; e del quinto, infine, è edito giusto un adattamento francese, ma non 
l'originale italiano. 

Tali contributi rappresentano complessivamente cinque diversi sguardi sulla linguistica generale, 
coprendone il vasto orizzonte con cinque occhi diversi. Geograficamente, vanno dalle Americhe 
(con la tassonomia delle lingue ameride) all'Asia (con le intricate vicende del Prete Gianni) con al 
centro la vecchia Europa (con l'anadeissi nelle lingue balto finniche). Metodologicamente, invece, la 
scelta è incardinata sulla linguistica storica (con i lavori posti alle estremità della cernita, quello 
ameridio e quello asiatistico, ma soprattutto con quello baltofinnico posto al centro, che ne è il vero 
cuore pulsante); intorno a questi, in posizione mediana, ci sono sia la storia della linguistica (col 
confrontro tra generativismo e linguistica del corpora) sia la più spiccata attualità sincronica (con i 
corpora di CMR). 

La presentazione è, quindi, chiasticamente arrangiata come nello schema musicale cosiddetto "a 
ponte" del quarto e del quinto quartetto di Bartók, o della decima sinfonia di Mahler. In posizione 
esposta, di apertura, è però collocato il pezzo amerindio perché è forse il più "scomodo" ed è 
intorno ad esso che la raccolta è stata ideata. 

Tutti i lavori sono presentati con le norme (specie bibliografiche) care all'autore, perlopiù 
disattese in base ai capricci redazionali degli editori: qualora versioni parziali o semiedite fossero 
già in esistenza, norme e bibliografia sono state ricorrette ed uniformate; il testo non è invece stato 
di solito davvero aggiornato, anche se non si è rinunciato ad ancora apportare poche correzioni ed 
aggiunte qui e là. 



Torino, 4 dicembre 2012. 



Tassonomia, filogenesi ed altro: 
la classificazione linguistica del Nordamerica*. 



(Erinnere dich, daji wir manchmal Erklàrungen fordern nicht 
ihres Inhalts wegen, sondern der Form der Erklàrung wegen. 
Unsere Forderung ist eine architektonische; die Erklàrung 
eine Art Scheingesims, das nichts tràgt.) 
Ludwig Wittgenstein, Philosophische Untersuchungen, 1.217. 

II n'y a rien, dans l'univers, de merveilleux. II n'y a rien de 
cache. Le monde est un grand livre ouvert ... mais ilfaut savoir 
lire, n'est-ce pas? C'est seulement la sottise humaine qui 
donne naissance au miracle (... et mème au voi en artière!!). 

Jaime de Angulo, Indians in Overalls, 1950, p. 327. 

Mi avvedo, notò in particolare, che lei è d'accordo con Abe- 
lardo. Apprendendo ciò Pofi assunse un aspetto che era la 
diagonale tra la sorpresa e il sussiego. 

Antonio Pizzuto, Sì riparano bambole, 1960, [capo 8]. 



0. Intenti. Il presente contributo si articolerà in tre sezioni, una preliminare, prevalente- 

mente negativa, sulla situazione comparativistica nordamericana e generale (§ 0-2), una seconda che 
metterà in campo alcune idee (metaforiche (§ 3) ed una terza (§ 4) che esibirà e parcamente 
commenterà un risultato concreto a queste ispirato. Tutto il discorso sarà mantenuto ad un livello che, 
per usare l'immagine di Wittgenstein in epigrafe (che ho già sfruttato in Barbera - Corino - Onesti 
2007b), definirei architettonico: ci terremo principalmente ai cornicioni (cercando di non cadérne). 

0.1 Premessa. La storia della classificazione delle lingue nord- e mesoamericane si 

potrebbe, a mio avviso, schematizzare in tre fasi salienti, sia pure precedute da una lenta 
preparazione: (1) quella aurorale che, iniziando da Gallatin 1836 culmina in Powell 1891, (2) 
quella matura ma visionaria di Sapir, epitomata da Sapir 1929 e fissata da Voegelin - Voegelin F 
1965, e (3) il consensus attuale, successivo alla sistemazione di Campbell - Mithun 1979 e 
Campbell 1997, rispecchiato soprattutto da Golla et ahi 2007 (che condensa i risultati anche di 
Goddard 1996 e Mithun 1999) e, in misura minore e con importanti diversità, dall' Ethnologue 
(Lewis 2009); in mezzo a questi tre momenti cruciali vi sono state naturalmente molte altre 
proposte 1 e varie acquisizioni più puntuali, a volte anche assai importanti. Noi, comunque, ci 
occuperemo, ed assai schematicamente, quasi solo delle fasi (2) e (3), ad esclusione quindi di (1) e 
delle sue, pur assai interessanti, preparazioni . 



* Il presente contributo è solo la parte introduttiva (e prima pubblica) di una più vasta ricerca (o meglio pratica) sulla 
classificazione delle lingue, che mi accompagna da molti anni; una seconda (più approfondita ma sempre parziale) fase 
verterà sulle lingue otomanguee. Di ciò va ringraziato l'amico Gianguido Manzelli (che certo non condivide le mie idee, 
di cui sono il solo non pentito (ir)responsabile) che mi chiese di scrivere per il pubblico della Terza giornata di studi 
italiani sulle lingue amerindiane. Pavia - 8 giugno 2012 quello che fino ad ora è stato un mio privato esercizio. Tale 
forse sarebbe dovuto restare, e probabilmente non fu una grande idea, ma pazienza. 

1 Tra le più interessanti, ad esempio, vi è stata l'ipotesi di raggruppamento estratta dalla Haas dallo Hokan di Sapir (cfr. infra) 
e chiamata Proto-Gulf; ipotesi che ha, se non altro, servito a mostrare la fragilità della ipotesi hoka e l'esistenza di molte altre 
trame di difficile razionalizzazione: HAAS 1951 e 1952, e cfr. le puntuali osservazioni di GODDARD 1996, p. 316a. 

2 Su cui efficacemente informa GODDARD 1996; sul preparatorio periodo ancora precedente cfr. CAMPBELL 1997, pp. 
28-43; su Powell cfr. Sturtevant 1959. Nella fase tra Powell e Sapir, ossia per la preparazione della eruzione 
sapiriana, importano i due contributi di Boas, specie il secondo per l'argomento diffusionale: BOAS 1920 e 1929. 



In questa articolazione stupirà vedere assente Greenberg 1987 e quel che ne è seguito: non è 
qui la sede per contestarlo, è già stato fatto più volte , ed era anche facile gioco farlo. La ragione 
della sua assenza (e del mio voluto disinteresse) è comunque presto detta: quello che mi concerne 
sono le ipotesi scientifiche (o che almeno hanno cercato di esserlo) sulla preistoria delle lingue 
americane, non una cattiva teologia o metafisica su di esse 5 ; e ciò anche al di là di ogni questione 
glottogonica 6 , che ritengo peraltro mal posta e comunque esulare da ogni linguistica scientifica 7 . 
Quando qualcosa di oggettivamente valutabile vi sarà , lo si valuterà, per ora è assolutamemte vano 
sporcarsene le mani. 

Ma messa tra parentesi questa cortina illusionistico-spiritualistica, ed accantonato il suo primo 
lever de rideau, la vicenda si può leggere, nel passato, come un tentativo di dare una visione unitaria, 
unificante, divinando al di là dei dati quelle connessioni che una linguistica del futuro potrà forse 
dimostrare, ed un presente nel quale molte di queste connessioni non sono state dimostrate (così le 
ipotesi penutian e hokan di medio raggio) o sono state dimostrate affatto infondate (come nel caso 
della connessione athapask dello haida , o hoka del tlapaneco ). In effetti questa storia è stata spesso 



3 A partire (per limitarsi ad un riferimento tra mille) dallo storico CAMPBELL 1988 al più recente CAMPBELL 2004; cfr. 
anche l'ottimo MATISOFF 1990, con cui mi trovo in pressoché perfetta sintonia. 

4 Non è qui il luogo per argomentarlo, ma per me questo significa prevalentemente un uso accurato del metodo storico- 
comparativo, che resta l'unico strumento certamente valido per il linguista storico: una esposizione magistrale di come 
il metodo funzioni è sempre quella contenuta in HJELMSLEV 1963, ed una (senz'altro meno magistrale) di perché 
funzioni è in BARBERA 2002-10, § 2.0.7. Strumento, peraltro, che, oggi, sta venendo affinato soprattutto in aree, 
finalmente, extraindoeuropee, specie austronesiane, oceaniche e papua (basti pensare ai contributi di Ross). 

5 Per usare le parole di MATISOFF 1990, 107, certo meglio attrezzato di me a reggere ifurores dei greenberghiani (ed 
oltre): «for many linguists, such views fall more into the category of religious beliefs than scientifically testable 
hypotheses, about on a par with claims that "ali languages have the same underlying deep structure" and "the position 
of the stars at the moment of our birth determines our character"». Che poi è semplicemente un efficace aggiornamento 
di quello che enfaticamente già diceva negli anni Settanta il Doerfer «Schluss mit dem mystisch-verschwommenen 
Omnicomparativismus! Historische Sprachwissenschaft: Ja! Rekonstruirende Sprachwissenschaft: Ja! Glottogonische 
Sprachwissenschaft: Nein!» (DOERFER 1973, p. 122). 

6 Pure, è appena onesto almeno accennare alla mia posizione in proposito: non credo alle ipotesi monogeniste più di 
quanto non creda alla veracità delle piume dell'arcangelo Gabriele di boccacciana memoria. Si tratta, infatti, di una 
posizione fideistica non sostenuta da uno straccio di evidenza empirica; e neppure di verosimiglianza: anche l'argo- 
mento della pretesa maggiore economicità della monogenesi delle lingue umane è semplicemente falso, dato che, a 
differenza del vivente, non esiste per le lingue alcuna barriera riproduttiva o soglia di ibridazione atta a garantirne la 
filogenesi unitaria (anzi in tutte le tradizioni linguistiche note si è sistematicamente constatato proprio il contrario), e 
l'analogia con l'albero della vita è quindi solo illusoria: le lingue sono un mondo in cui tutti i muli hanno prole fertile, 
gli asini abbondano, ed anche le chimere. E pure considerando il linguaggio organizzato, anziché le lingue storiche, non 
è possibile collegare neanche questo alla speciazione del Homo sapiens, essendoci buone prove che si tratti di una 
plesiomorfia che appare (diversamente, certo) in vari rami dei Metazoa. Quanto invece alla capacità di comunicazione 
simbolica, questa sì è una sinapomorfia che però collega tutto il vivente, giusta l'ipotesi biosemiotica sull'origine della 
vita molto più nota tra i biologi (qualsiasi buon manuale di biologia evoluzionistica non può esimersene: cfr. ad es. 
Futuyama 1998, p. 173; più diffusamente cfr. Smith - Szatmhàry 1995) che tra i linguisti. Su questi argomenti ho 
sostato un poco meno cursoriamente in BARBERA 2002- 10, §§ 1.5.0-8, con bibliografia. 

7 L'esclusione che ne fece temporibus illis dal proprio statuto la Société de Linguistique de Paris andrebbe tuttora, 
nonostante tutto, mantenuta salda: «La Société de Linguistique a pour objet l'étude des langues et l'histoire du langage. 
Tout autre sujet d'études est rigoureusement interdit» (Art. 1 : Aa. Vv. 1876, p. j). Sante parole ... 

8 Ed è appena onesto riconoscere che qualcosina in quella direzione si sta debolmente muovendo, nonostante la nefasta 
influenza di personaggi come Ruhlen, prevalentemente ad opera della scuola russa di Starostin senior ed ora junior; ma 
è ancora decisamente troppo presto per scendere in questo agone. 

9 Altre però sono state invece dimostrate, come quella di wiyot e yurok con l'algonkino, già sostenuta da Sapir 
medesimo (cfr. Sapir 1913 e 1923, per citare solo le estremità, nonostante la ostinata e futile opposizione di Truman 
Michelson, che pure era un algonkinologo di assoluta vaglia) e finalmente confermata da HAAS 1958. 

10 Proposta da Sapir 1915 e definitivamente scartata da Campbell 1997, 284b-86a, che dà anche un riassunto della 
ormai lunga vicenda. 

11 Risaputamente articolata da Sapir 1925 seguendo un suggerimento di Lehmann 1920, e definitivamente da scartare 
una volta solidamente accertata l'appartenenza del tlapaneco (e con lui del subtiaba) all'otomangueo da RENTSCH 1977 
e Suàrez 1979; la questione è assai rilevante, non solo perché Sapir 1925 è forse l'ultima e più vasta definizione di 
Sapir della sua ipotesi Hokan, ma anche perché «Sapir's concept of "deep-rooted" structural similarities as evidence for 
remote linguistic relationship» (BRIGHT 1990, p. 334) è eminentemente in gioco in quella proposta. 
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presentata come una tensione tra lumpers e splitters, tra due opposte tendenze dello spirito, verrebbe 
da dire, anziché poggiata su questioni più propriamente scientifiche ed obiettive, in parte, a mio parere, 
andando contro le intenzioni di Sapir stesso. Non è però, come vedremo nel § 3, questa l'unica 
maniera di considerare la matassa, anche se, storicamente, è quella che maggiormente si è imposta. 

1. Sapir E successori. L'ipotesi di Sapir, riassumibile nello schema seguente, tratto da 

Sapir 1949/29, pp. 172-3, è certo bold nel ridurre a 6 ragguppamenti gli originari 58 di Powell. 

PROPOSED CLASSIFICATI ON OF AMERICAN 1NDIAN LANGUAGES 

NQRTII OF MEXICO (AND CERTAIN LANGUAGES OF 

MF,XICO AND CENTRAL AMERICA) 

I. Eskimo -Aleul 

II. Algonkin-Wakashan 



l. Algoiikin-Ritwfni 




2. Kootenay 


(1) Algonkin 




3. Mosan (Wakaahan-Saliah) 


(2) ReoUiuk (?) 

(3) Ritwan 




(1) Wakaahan (Kwakiutl-NootkaJ 


(a) Wiyot 




(2) Chimakuan 


(b) Yurok 




(3) Saliah 




III. Nadene 


I. Haida 




Continental Nadene 


2. Continental Nadene 




(1) Tlingit 


(*ee oppasite} 




(2) Athahaskan 




IV. Penutian 


1. Californian Penutian 




(3) Kalapuya 


(1) M i wok- Costa noan 




3. Cbinook 


(2) Yokuts 




4. Tsi inshi un 


(3) Mattili 




5. Plateau Penutian 


(4) Wintun 






2. Oregon Penutian 




(1) Sahaptin 


(1) Tnkclmn 




(2) tVniilótpuan (Molala-Ca-yliac) 


(2) Coast Oregon Penutian 




(3) Lutuami (Klamath-Modoc) 


(a) Coog 




6. Mesrican Penutian 


(b) Siuslaw 




(1) Mixe-Zoque 


(e) Yakonan 




(2) II u ave 


V 


. Hokan-Siouan 


1. Hokan-Coshuiltecan 




(2) Coabullteco 


A, Hokan 




(a) Coahuilteco proper 


(1) Northern Hokan 




(b) Cotonarne 


fKarok 




{e} Comecrudo 


(a) «■ | Chimariko 




(3) Karankawa 


\Shaata-Achomawi 


2. Yuki 


(b) Yann 




3. Keres 


(e) Pomo 




i. Tunican 


(2) Washo 




(1) Tunica- Atakapa 


(3) Eseeleii-Yurnan 

(a) Easelen 

(b) Ywman 




(2) Chitimncha 
5. Iroquois-Oaddoan 

(1) Iroquoian 

(2) Caddoan 


(4) Saltnan-Seri 




6. Eaatern group 


(a) Salinan 




(1) Siouan-Yuchi 


(b) Chumnah 




(a) Siotian 


(o) Seri 




(b) Yuohi 


(5) Tequistlatecan(Chontal) 


(2) Nateli ci -Muskogian 


B. Subtiaba-Tlappanec 




(a) Natebez 


C. Coahuiltccan 




(b) Muakogian 


(1) Tookawa 




(e) Timucua (?) 


VI. Aztec-Tanoan 


1. Uto-Aztekan 




2. Tanoan-Kiowa 


(1) NahuBtl 




(1) Tanoan 


(2) Pìma 




(2) Kiowa 


(3) Shoahonean 




3. Zufii (?) 



Tav. 1. La proposta di Sapir 1929. 

Il punto di leva in questa operazione sono le ipotesi penutica e hoka, che, ereditate da Dixon - 
Kroeber 1913, vengono enormemente allargate; non sono tuttavia quelle le proposte che sono poi 
state più confermate (se non in forme estremamente ridotte, soprattutto la penutica); il successo è 
semmai spettato ai raggruppamenti (ora vere famiglie) utoazteco 13 , algonkino ed athapask. 



12 Soprattutto ad opera dei greenberghiani e di altri lumpers più o meno spregiudicati e di scarsa assennatezza. 

13 Non si può non citare lo splendido e ground breaking Sapir 1913-15, certo uno dei suoi capolavori. 
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Ma al di là di considerazioni numeriche, ciò che più colpisce è lo sforzo di trovare una 
ratio in un caledoiscopio inafferrabile, conciliando argomenti tipologici con argomenti 
genealogici. La linguistica successiva ha in genere teso ad ingessare e trasformare in una 
ortodossia quella che era solo una ipotesi di lavoro, la (forse) azzardata ma (era da sperare) 
stimolante scommessa consegnata alla ricerca scientifica futura da un uomo di immensa e 
(temo) ineguagliabile esperienza: «suggestive but far from demonstrable in ali its features in 
the present time» la dichiara Sapir. Nell'immediato, però, lungi dall'esser suggestive, sortì 
un risultato contrario: «work on classifying North American languages carne to a standstill 
[...] and it was two decades before it served Sapir's intended purpose of being a framework 
subject to revision based on further investigation» (Goddard 1996, pag. 313a). 

In realtà, però, la ripresa 14 dopo il ventennio di blocco, non esaudiva tanto Sapir's intended purpose 
quanto avviava la trasformazione in ortodossia, che si era in effetti iniziata già prima, con la pubblicazione 
(cui alludeva Goddard cit.) di un'autorevole mappa (Voegelin - Voegelin E 1944), e che è da conside- 
rarsi conclusa 15 conVOEGELiN-VOEGELiNF 1965 16 (nella schematizzazione di Goddard 1996, p. 319): 



I. American Arclic-Paleosiberian Pnytum 

la Eskimo-Aleut lamguage family 

Ila Chukchi-Kamchatkan language family 
D. Na-Dene Phylum 

Ila Athapascan language family (includes Eyak) 

Ilb Tlingit language isolate 

Oc Haida language isolate 

III. Macro-Algonquìan Phylum 

Illa Algonquian language family 

[Ilb Yurok language isolate 

■Ile Wiyot language isolate 

llld Muskogean language family 

llle Natchez language isolate 

Illf "Atakapa 

Illg Chitìmacha language isolate 

Illh Tunica language isolate 

[Ili *Tonkawa (dubiously classified) 

IV. Macro-Siouan Phylum 

IVa Siouan language family 

IVb Catawba language isolate (part of or closely linked to 

Siouan) 
IVc Iroquoian language family 
IVd Caddoan language family 
IVe Yuchi language isolate 

V. Hokan Phylum 

Va Yuman language family 

Vb Seri language isolate 

Ve Pomo language family 

Vd Palaihnihan language family 

Ve Shastan language family 

Vf *Yanan language family 

Vg Chimariko language isolate 

Vh Washo language isolate 

Vi *Salinan language family 

Vj Karok language isolate 

Vk *Chumashan language family 

VI *Comecrudan language family 

Vm Coahuiltecan language isolate 



Vn *Esselen language isolate 

Vo Jìcaque language isolate 

Vp Tlapaneean (Subtiaba-Tlapanec) language family 

Vq Tequistlatecan language family 
Vi Penutian Phylum 

Vìa Yokuts language family 

VIb Maidu language family 

Vie Wmtun language family 

Vld Miwok-Costanoan language family 

Vie Klamath-Modoc language isolate 

Vlf Sahaptin-Nez Perce language family 

VIg *Cayuse language isolate 

Vlh * Molale language isolate 

Vii Coos language family 

VIj Yakonan language family (or Alsea and 

Siuslaw-Lower (Jmpqua, two language isolates) 

Vlk Takelma language isolate 

VII Kalapuya language family 

VIm Chinookan language family 

VIn Tsìmshian language isolate 

VIo Zuni language isolate 
VII. Aztec-Tanoan Phylum 

Vlla Kiowa-Tanoan language family 

Vllb Uto-Aztecan language family 
Vili. Language Isolates and Families With Undetermined 
Phylum Affiliations North of Mexico 

Villa Keres language isolate 

VHIb Yuki language family 

Ville *Beothuk language isolate 

VUId Kutenai language isolate (with possible remote con- 
nections to Algonquian, Salish, and Wakashan) 

Ville Karankawa language isolate 

VHIf Chimakuan language family 

VHIg Salish language family (with possible affiliation to 
Algonquian) 

VUIh Wakashan language family 

Villi *Timucua language isolate 



Tav. 2. Lo schema di Voegelin - Voegelin F 1 965. 



Il primo veramente importante lavoro comparatistico uscito è probabilmente WOLFF 1950-1 sul proto-sioux. 

15 Operazione cui non si sottrae del tutto il pur assai buono PFNNOW 1964: si veda però come rifiuti l'inclusione dei suoi Coos- 
Takelman (± 1' "Oregon Penutian"), del Chinook-Tsimshian e del Klamath Sahapian nel penutico, così come quella del 
Comecrudo-Karankawa e delYAtakapa-Muskogean nello hoka. Il testo di Pinnow, studioso più famoso nel campo 
austroasiatico, è un commendevole (per quanto, ovviamente, datato) manuale, ingiustamente poco diffuso tra gli americanisti. 

16 Non privo di curiose, e più o meno (in)spiegabili, bizzarrie come lo spostamento di buona parte del contigente del SE 
dallo Hokan di Sapir al macro-algonkino. 
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Nonostante molte evoluzioni in positivo (nella fattispecie ammissioni di errori poi comprovati 
presenti nel "suggerimento" di Sapir), come la separazione del gruppo sioux dallo hoka od il 
confinamento nel gruppo ottavo di molti non possumus, è proprio questa ufficializzazione che ha 
costituito il punto di partenza delle follie dei lumpers, che spesso non considereranno più 
l'indimostrabilità come un problema (visto che lo schema di Sapir dimostrato non era, e ci 
mancherebbe), od abbasseranno considerevolmente la soglia dei requisti minimi per provare 
qualcosa. 

2. Verso il consensus moderno. La visione più realistica alla base dello standard 

moderno, che considera relato solo il dimostrato tale, non esaudisce molto le speranze di Sapir, 
frammentando anzi il quadro, tanto che sembra superficialmente un regressus ad Powell: ma tale è 
la realtà, non una vocazione di splitters. 



17 Incoraggiati in ciò anche da poche sortite infelici (e non a caso mai espresse in articoli pubblici, ma solo 
privatamente), di Sapir medesimo come la teoria sino-athapaska (cfr. Sapir 1991/21): cfr. Campbell 1966, pp. 287b- 
88b. Idea che, anzi, si è traformata in un vero e proprio "genere", quello delle comparazioni "inter-Bering", che, partite 
col Sino-Athapaskan di ShÀFER 1952 (che sembra malaccortamente esaudire le fantasie di Sapir), attraversano varie 
forme più o meno improponibili, come Y Uralo-Penutian di SADOWSKY 1976, ed approdano finalmente al Dene-Jenissei 
di VAJDA2010, che sta recentemente riscuotendo consensi inaspettati (ed a mio parere abbastanza immotivati); il genere 
ha peraltro i suoi antenati ottocenteschi, come l'ipotesi "inter-pacifica" di connettere l'austronesiano alle lingue della 
Northwest Coast di HILL-TOUT 1898, per non parlare delle, ovvie ed attese, chiamate in causa "inter-atlantiche" del 
basco, a partire almeno da Charencey 1867 che, non pago di avere già collegato il basco all'uralico (cfr. Charencey 
1862, tentativo peraltro frequente e cui aveva recato lustro anche il principe Bonaparte, cfr. BONAPARTE 1862) poi lo 
collegava pure all'algonchino; ed in questa linea va posta anche la connessione indoeuropeo-azteca posta dal sagace 
amateur Thomas Stewart Denison (cfr. DENISON 1913) o quella "scitico"-quechua del pervicace (in quanto non nuovo a 
simili imprese: ELLIS 1870) ed estroso Robert Ellis (cfr. ELLIS 1875, un ricco minestrone cui nulla o quasi manca). 

Beninteso, infatti, le "sortite infelici" ci sono sempre state, e ben prima di Sapir. Un piccolo catalogo di questo 
improbabile circo Barnum è in CAMPBELL 1997, pp. 261a-2b, cui pure manca quella che a mio parere è la perla di tutte 
le perle: la fascinosa storia delle sorti dei Cari secondo Vorhagen 1876. Nelle parole di Vignaud 1922, p. 6 «Les 
Cariens, petit peuple de l'Asie-Mineure, qui prit parti pour les Troyens, lors de la guerre de Troie, étaient, selon notre 
auteur, Touraniens, comme les Egyptiens, c'est-à-dire Mongols. Vers le Ville siècle, ils résolurent de s'expatrier en 
masse et, par fortune de mer, furent portés aux Antilles, d'où il passèrent au continent, dont ils occupèrent plusieurs 
parties. Mais c'est dans la vallèe de L'Amazone qu'ils se fixèrent; ils s'y développèrent et y devinrent les célèbres 
Tupis, connus aussi sous le nom redoutable de Caribs ou Cara'ibes». Abbiamo ha che fare con un vero scrigno di 
mostruosi gioielli, tanto che non si saprebbe da che parte incominciare (i Cari che sono Egiziani, cioè Mongoli; i Tupi 
che sono Caribe; ...); ma al di là dei dettagli (pur mirabolanti) ad incantare è l'afflato narrativo che muove quella 
fantasia: Atlantide, Mu e Corto Maltese sono lì lì a due passi, sembra di toccarli. Naturalmente le Americhe non hanno 
certo l'esclusiva di simile genere di attenzioni: basco, giapponese e Creta antica a parte (che detengono indisputabil- 
mente le posizioni di testa in questa hit parade), una menzione ammirata la merita certo l'ardimentoso reverendo 
MacDonald che riconduceva il proto-austronesiano all'arabo, pubblicando degli stupefacenti dizionario e grammatica 
comparati di efate meridionale (MacDonald 1894 e 1907). 

Ma se queste sono solo rarae aves e divertono, sia pure involontariamente, dopo Greenberg le corbellerie si 
moltiplicano in modo allarmante, distogliendo spesso la ricerca dai problemi veri della linguistica storica, e cessano di 
essere divertenti. Anzi, il monito allarmato e sconfortato lanciato una dozzina di anni fa dal grande e già citato tibeto- 
birmanista James Matisoff è sempre attuale: «there is a Constant temptation among linguists to be the first to 'discover' 
a new subgroup within a recognised family (cf Thurgood 1984; van Driem 1997), or a farflung relationship between 
language families on opposite sides of the globe. The easiest proposals to dismiss as chimerical are those which depend 
entirely on surface similarity among forms from modem languages, without bothering to attempt reconstructions of 
proto-forms in the languages to be compared. In this category belongs Greenberg 1987, an attempt to group ali the 
languages of the Western Hemisphere into three families: 'Amerind', Eskimo-Aleut and Na-Dene. As an exercise in 
megaloco mparison, I had no difficulty in coming up with about 50 good-looking 'cognates' between Amerind and 
Proto-Sino-Tibetan or Proto-Tibeto-Burman. This exercise took about three hours by the clock, but did not fili me with 
any exhilaration, only a vague depression that this sort of things was so easy. Even more dangerous are serious 
megalocomparative efforts that are clothed in the trappings of the traditional comparative method, that use 
reconstructed forms, and that puport to show 'regular correspondences' among 'cognates'. Despite the occasionai 
brilliance of such endeavours, what they ali have in common is tortured sound-correspondences, disregard of counter- 
examples to 'sound laws', and unconstrained semantic latitude. We ali have to take a deep breath, and admit that the 
comparative method has intrinsic, ineluctable limitations. The remote linguistic past is a dark tunnel, and the torch of 
the comparative method can only illuminate it so far. It goes without saying that lexicostatistics - which is at best a 
feeble adjunct of the comparative method - cannot push the light back any farther» (MATISOFF 2000, p. 357). 
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Nella prima formulazione di Campbell - Mithun 1979 (che segna il primo ritorno coi piedi 
sulla terra), anzi, il conto è fin più alto dei 58 di Powell. Infatti, riproducendo la efficace schema- 
tizzazione di Goddard 1996, p. 320a, si avrebbe: 



Eskimo-Aleut 
Nadene 
Haida isolate 
Algonquian-Ritwan 
Muskogean family 
Natchez isolate 
Atakapa isolate 
Chitimacha isolate 

8. Tunica isolate 

9. Tonkawa isolate 

10. Siouan family 

1 1. Iroquoian family 

12. Caddoan family 

13. Yuehi isolate 

14. Yuman family 

15. Seri isolate 

16. Pomoan family 

17. Palaihnihan family 

18. Shastan family 

19. Yanan family 

20. Chimariko isolate 

21. Washo isolate 

22. Salinari family 

23. Karok isolate 

24. Chumashan family 

25. Cotonarne isolate 

26. Comecrudo isolate 

27. Coahuilteco isolate 

28. Aranama-Tamique isolate 

29. Solano isolate 

30. Esse le n isolate 

31. Jìcaqne family 



32. Subtiaba-Tlapanec family 

33. Tequistlatecan family 

34. Yokuts family 

35. Maiduan family 

36. Wintuan family 

37. Miwok family 

38. Costanoan family 

39. Klamath-Modoc isolate 

40. Sahaptian family 

41. Cayuse isolate 

42. Molala isolate 

43. Coos family 

44. Alsea isolate 

45. Siuslaw-Lower Umpqua 
isolate 

46. Takelma isolate 

47. Kalapuya family 

48. Chinookan family 

49. Tsimshian isolate 

50. Zuni isolate 

51. Kiowa-Tanoan family 

52. Uto-Aztecan family 

53. Keresan family 

54. Yukian family 

55. Beothuk isolate 

56. Kutenai isolate 

57. Karankawa isolate 

58. Chimakuan family 

59. Salish family 

60. Wakashan family 

61. Timucua isolate 

62. Adai 



Tav. 3. Lo schema di C AMPBEt l - Mithun 1 979. 



•19 



Il consenso attuale, rispecchiato da Golla et alii 2007 , risolve ancora alcuni nodi ' e sistema 
meglio i dati, arrangiandoli (relativamente e con numerose eccezioni) in un approssimativo ordine 
geografico (seguendo un circuito circolare ed antiorario dal NW al NE, come era già, peraltro, 
anche nella sequenza espositiva di Campbell 1997). La tavola seguente ne fornisce uno schema 
riassuntivo (privato della lista completa delle lingue): 



Ed analoga sistemazione per la Mesomaerica è presentata da Terrence Kaufman (Kaufman 2007). 
19 Ad esempio la problematica posizione dello Haida; altri però ne crea, come ad esempio la confusione tra nomi di 
famiglia e nomi di lingua, cfr. infra. 
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1 Eskimo -Aleut (Eskimo, Aleut) 

2. Algic (Algonquian, Ritwan) 

3. Na-Dene (Tlingit, Eyak-Athabaskan) 

4. Haida 

5. Wakashan (Northern, Nootkan) 

6. Chimakuan (Chemakum^ , Quileute'f) 

7. Salishan (Bella Coola, C Salish, Tsamosan, 
Tillamook, Int. Salish) 

8. Tsimshianic (Nass-Gitksan, Coast Tsimshian) 

9. Chinookan (Lower Chinook\, Kathlameff% 
Kikshi) 

10. Alsean (Alsecff , Yaquina^) 

11. Siuslawf 

12. Coosan (Hanisf , Milukf) 

13. Takelman'f'f 

14. Kalapuyan (Tualatin-Yamhiltf , CKapauyarff, 
YoncallaX) 

15. Wintuan (Wintu-Nomlaki, Patwirì) 

16. Maiduan (Maiduf, Konkow, Nisenattf) 

17. Utian (Miwok, Costanoantt) 

18. Yokuts {Palewyami'\'\ , Buena Vistai, Tule-Ka- 
weah, King's River, Gashowu% Volley Y.) 

19. Plateau (Penutian) (Klamath, Sahaptin, Molala^) 

20. Karuk 

21. Chimariko'f 

22. Shastan (Shastwf, New River 57z.| | , Okwanu- 
chuW, Konomihw\\) 

23. Palaihnian (Achumawi, Atsugewi'f) 

24. Pomoan (7VEP.|, SEP.-\,EP., W P.) 

25. 7anaff 

26. Salinan {Antoniano^ , Migueleno\) 

27. Cochimi-Yuman (Yuman, Cochimif f ) 

28. Guaicuran^ 

29. ^a^o 

Tav. 4. Lo schema di 



30. Yukian (Yukv\, Wappo\) 

3 1 . Esselen (Esselerrf |) 

32. Chumashan (N Ch|, 5. C7l, C Ch.|(t), Mand 

C/?.ft) 

33. Uto-Aztecan (Numic, Tubatulabal, Takic, //op/, 
Tepiman, Taracahitic) 

34. Kiowa-Tanoan (Kiowa, Jemez, Tiwa, Tewa, 
Pz'roff) 

35. Keresan (Acoma-Laguna, Rio Grande K.) 

36. Zm«/ 

37. Coahuilteco'f'f 

38. Comecrudan (Comecrudo^ , Mamulique^ , 
Garzati) 

39. Coto«ameff 

40. AranamaH 

41. Solano^ 

42. À!aran&awatt 

43. Kootenai (Kutenai) 

44. Cajwsell 

45. Siouan-Catawban (Siouan, Catawban|(|)) 

46. 7bnA:awa| 

47. Caddoan (N C, S C.) 

48. Adaitt 

49. Atakapan (W A.||, E A.||) 

50. Chitimachat 

51. Tunica^ 

52. Muskogean (W M, E M.) 

53. Natchez^ 

54. Yuchi 

55. Timucuan (Timucua'f'f, Tawasa^t) 

56. Ca/Msa|| 

57. Iroquian (N 1., S 1.) 

58. Beothuk\-\ 

G0LLAefa///2007. 



Al di là delle soluzioni puntuali, quello che vorrei notare è lo sforzo di integrare informazioni 
diverse nello schema filogenetico nudo, soprattutto quelle geografico-areali (con la generale 
disposizione dei materiali) e quelle storico-filologiche (con l'indicazione della estinzione pre-1930 o 
post-1930; nella mia schematizzazione l'informazione è resa rispettivamente con la croce doppia, ||, o 
singola, | 20 ). Ed è in questa direzione che bisogna muoversi, come mostrerò nei paragrafi seguenti. 

Altre questioni, di ordine piuttosto tassonomico, sono meno efficientemente risolte. Soprattutto è la 
distinzione tra Famiglia e Lingua (che rappresentano due taxa diversi, anche se convergono nelle 
lingue isolate) che non è ricavabile sistematicamente : nella Tav. 4 la distinzione (resa col carattere 
tondo = famiglia e corsivo = lingua) è stata introdotta da me per facilitare la ispezione della questione, 
ma è assente nell'originale. Si vedano ad esempio i casi 28-29, in cui alla "lingua isolata = famiglia di 
se stessa" nell'un caso è stato attribuito il suffisso (formante nomi di famiglia) -an e nell'altro no (e 
pure Washoan sarebbe stato ben possibile); o la curiosa scelta in 43 per cui la famiglia si chiama 
Kootenai e la lingua Kutenai: un poco d'ordine non guasterebbe. 

Diverso, come accennavamo, è il discorso per YEthnologue, poiché il suo interesse è più sul pre- 
sente (solo lingue vive, od al più moribonde!) e sull'inventario delle lingue (rami bassi dell'albero) che 



20 Nell'originale tt è espresso col corsivo e | con l'asterisco. 

21 Lo era invece nella precedente di Campbell - Mithun 1979, cfr. Tav. 3. Nella versione completa non potata delle lingue 
tale problema si smorza ma non si annulla. 
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non su raggupp amenti e subraggruppamenti (rami alti). Significativamente, per l'organizzazione 
generale delle famiglie, il punto di riferimento per VEthnologue sembra ancora Voegelin - Voegelin 
F 1965 piuttosto che Campbell - Mithun 1979 e successivi: si vedano, infatti i capisaldi dello schema 
(post)sapiriano, cioè il raggruppamento penutico (Tav 5), che non è certo ridotto alle sue componenti 
base Miwok-costano ("Utian" 17) e Klamath-molala ("Plateau" 19) ma mantiene buon numero delle 
affiliazioni sapiriane tradizionali ed indimostrate, 



Penutian 

Penutian (33) 

California Penutian (1) 
Wintuan (1) 

Wintu [wft] ( United States ) 
Chinookan (2) 

Chinook [chh] (United States) 
Wasco-Wishram [wacl ( United States ) 
Maiduan (4) 

Maidu, Northeast [nmu] ( United States ) 
Maidu, Northwest [midi ( United States ) 
Maidu, Valley |vmv] ( United States ) 
Nisenan [nsz] ( United States ) 
Oregon Penutian (5) 

Coast Oregon (3) 

Coosan (1) 

Coos fesz] ( United States) 
Siuslawan (1) 

Siuslaw [sjsj ( United States ) 
Yakonan (1) 

Aisea [aes] (United States) 
Kalapuyan (1) 

Kalapuya [kvl:[ (United States ) 
Takelma (1) 

Takelma rtkml ( United States ) 



Plateau Penutian (6) 

Klamath-Modoc CI) 

Klamath-Modoc [klaj ( United States ) 
Sahaptin (5) 

Nez Perce [nez] ( United States ) 
Tenino |tqn] ( United States ) 
Umatilla [urna] (United States) 
Walla Walla [waal ( United States ) 
Yakima [yakl ( United States ) 
Tsimshian (3) 

Gitxsan [git] (Canada) 
Nisga'a [ncg] ( Canada ) 
Tsimshian [tei] ( Canada ) 
Unclassified (1) 

Molale [mbel ( United States ) 
Yok-Utian (H) 

Utian (10) 

Costa n pan (3) 

Karkin [krij] ( United States ) 
Ohlone, Northern [C3f[ ( United States ) 
Ohlone, Southern [css] (United States) 
Miwokan (7) 

Eastem (5) 
Western (2) 
Yokuts (1) 

Yokuts fyok) ( United States ) 



Tav. 5. Il penutico secondo Ethnologue. 
e quello hoka (Tav 6) per cui vale discorso analogo: 



Hokan 



Hokan (23) 

Esselen-Yuman (10) 
Esselen (1) 

Esseten [asql ( United States ) 
Yuman (9) 

Cachimi (1) 

Cochimi Icoil ( Mexico ) 
Delta-Californian (2) 

Cocopa [eoe] ( Mexico ) 

Kumiai Idi hi ( Mexico ) 
Kiliwa d) 

Kiliwa [klb] (Mexico ) 
Pai (1) 

Pai pai [ppi] ( Mexico ) 
River Yuman (3) 

Maricopa [mrc] (United States) 

Mohave Imov l ( United States ) 

Quechan [yum] (United States) 
Upland Yuman (1) 

Havasupai-Walapai-Yavapai Ivufl ( United States ) 



Northern (12) 

Karok-Shasta (4) 

Shasta-Palaihnihan (3) 
Palaihnihan (2) 
Shastan (1) 
Karok [kyJU ( United States ) 
Porno (7) 

Russian River and Eastem (6) 
Eastern (1) 
Russian River (5) 
Southeastern (1) 

Pomo, Southeastern [pom] (United States) 
Chimariko [cjd] ( United States ) 
Washo(1) 

Washo rwasl ( Unitad States ) 



Tav. 6. Lo hoka secondo Ethnologue. 
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Lo schema attuale, Ethnologue quindi a parte, anche nell'ultima e migliorata forma proposta (Tav. 
4), è certo meno leggibile, ossia, appunto, meno schematico, di quello sapiriano, ma rispecchia 
accuratamente lo stato della ricerca attuale, e tale è la realtà, che di solito non è mai semplice. 

3. Considerazioni metodologiche. Dobbiamo quindi rassegnarci? Forse no. 

Per arrivare dove voglio dobbiamo però partire dal concetto stesso di classificazione, distinguendo 
tra tassonomia e criteri: «se l'articolazione e la consensualità della griglia di classificazione, compen- 
diata nel concetto di tassonomia, è la prima lezione che abbiamo imparato dalla sistematica biologica, 
l'altro punto fondamentale è quello della arbitrarietà ed appropriatezza dei principi in base ai quali 
viene fatta una classificazione. Già intuitivamente è evidente che quando si fa una classificazione si 
hanno dei precisi scopi pratici: se metto in ordine le minute ferramenta posso voler separare, ad 
esempio, viti e chiodi lunghi da quelli corti perché ho due scatole di dimensioni diverse in cui metterli, 
od invece voler separare viti da legno da bulloni da ferro perché ho zone diverse del laboratorio per 
lavorare il legno ed il metallo. In entrambi i casi faccio una classificazione decidendo di mio arbitrio 
(in base ai mie scopi) il criterio in base ai quali assegno gli oggetti da classificare a taxa diversi» 
(Barbera 2002-10, § 2.0.3). 

In altri termini, la tassonomia dovrebbe essere il più possibile rigida (cfr. le obiezioni che abbiamo 
mosso poc'anzi a Golla et alii 2007 circa l' indistinzione tra i due taxa Lingua e Famiglia), ma i 
criteri e gli oggetti della classificazione possono variare, e dare luogo a sistemi misti, purché i criteri 
siano sempre chiaramente esplicitati. 

I biologi sono in ciò facilitati dal fatto che il loro taxon principale, la species, è di solito disegnabile 
in modo netto (facilmente in specie a riproduzione sessuata, per cui esiste la barriera riproduttiva, 
meno per specie a riproduzione asessuata, la grande maggioranza, per cui comunque si può sempre 
invocare la soglia di ibridazione o di ricombinazione genica) . Su tali basi hanno anche elaborato delle 
norme nomenclatorie fisse (anche se relativamente variabili da regno a regno), come nel seguente 
esempio di Tav. 7 (adattato da Kirk et alii 2008, p. 148 s.v. "Classification") che rappresenta lo 
standard attuale in micologia. 

II nostro correlato, cioè la lingua, purtroppo non è così ben definito (cfr Barbera 2002-10, § 2.0.2). 
Qualcosa però si potrebbe fare (due esperimenti in tal senso sono Barbera 2002-10, § 2.3.2 tav. 4, per 
le lingue uraliche, e Barbera 2002-10, § 2.3.4 tavv. 7 e 8, per le lingue balto finniche), e mi riservo di 
tornarvi sopra in un mio futuro lavoro sulle lingue otomanguee, da tempo in allestimento. 



22 In realtà le cose non sono proprio così semplici neanche per i biologi, come ben illustra lo stimolante RlCHARDS 2010; 
ma, comunque, sono più semplici che per i linguisti, ed in questa sede tanto può bastarci. 

23 La Puccinia graminis, qui usata come campione, è un famigerato fungo parassita, come in genere tutte le Uredinales, ben 
noto e temuto dai fitopatologi (per tacere dei contadini). 
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Principal, secondary and some other ranks in the nomenclatural hierarchy (botanical). 

Domain Eukaryota 

Kingdom Fungi 

Subkingdom f 

Phylum Basidiomycota 

Subphylum t -mycoUna 

Class Teliomycetes 

Subclass f -mycetidae 

Order Uredinales 

Suborder f -ineae 

Family Pucciniaceae 

Subfamily f -oideae 

Tribe Puccinieae 

Subtribe f -ittae 

Genus Puccìnia 

Subgenus Puccìnia 

Sectìon (Hetero-Puccinia) 

Subsection t 

Series f 

Subseries t 

Species Puccìnia graminis 

Subspecies Puccìnia graminis subsp, graminis 

Variety P. graminis var. stackmanii 

Subvariety "f 

Form f 

Subform t 

Special fonn Puccìnia graminis f.sp. avenae 

Physiologic Race P. graminis f.sp. avenae Race 1 

Individuai f 

f Not necessary for this example. 

Tav. 7. La classificazione in micologia secondo il Dictionary of the Fungi. 

Quanto invece ai criteri, è questa la zona in cui si potrebbe nel nostro caso fare di più, e non 
mancavano in tal senso precedenti nelle classificazioni che abbiamo passato in rassegna: si pensi alla 
presenza della tipologia nella proposta di Sapir, anche se non ne è ben chiara la distinzione dalla 
filogenetica (cfr. Sapir 1949/29, pp. 174-175; e questo era un problema); o si pensi piuttosto (passando 
a criteri più espliciti, o comunque meno pericolosi) all'ordine geografico ed alla informazione sulla 
qualità filologica dei materiali fornita dalla cronologia di estinzione che avevamo commentato in 
Golla et alii 2007 '. Aumentare i tipi di informazione in base a cosa è volta per volta utile (i criteri 
sono arbitrari e negoziabili, laddove la tassonomia sostanzialmente no), ma sempre chiaramente 
esplicitando le proprie operazioni: questa è la strada da seguire. Il criterio filogenetico, per il linguista 
storico, come per il biologo post-darwiniano, è certo quello principale ma altri ancora possono ben 
servire. La storia, ad esempio, può ridurre a dialetti di una determinata lingua varietà che 
originariamente ne erano indipendenti e che hanno diversa filogenesi (un caso di questo tipo è, ad 
esempio, quello delle varietà baltofinniche che avevo illustrato nell'ormai lontano Barbera 1993, 
p.103; un caso contrario, tra le lingue romanze, potrebbe essere quello del ladino). Inoltre di alcune 
varietà, pure sicuramente relate, non è disponibile alcun subragruppamento filogeneticamente valido (o 
per nostra ignoranza o perché il nodo superiore costituisce un linkage nel senso di ROSS 2008), sicché 
la distribuzione geografica diventa il fattore preponderante. Od ancora la distribuzione delle aree 
culturali non coincide con quella che la filogenesi linguistica disegnerebbe (se ne fosse in grado), come 
nel Nordovest americano o nella California settentrionale. 

4. Una proposta. Le considerazioni sopra svolte conducono ad una proposta specifica, che è 

quella sotto riprodotta; al cui proposito sono da aggiungere alcune osservazioni preliminari. 

In primo luogo, la copertura: già nelle classificazioni precedenti (soprattutto in quelle sapiriane) 
avevamo visto che al Nordamerica si mischiavano spesso pezzi di Mesoamerica (questo perché anche 
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se culturalmente rappresentano due aree ben distinte, pure linguisticamente non sempre lo sono : basti 
pensare alle lingue utoazteche, distribuite pressoché equamente nelle due aree, per tacere della commi- 
stione che vi è stata nelle varie formulazione delle ipotesi hoka e penutica). Qui anche la Mesoamerica 
(o puttosto quasi tutta l'America centrale, che i due concetti, culturale e geografico, non coincidono 
punto) è rappresentata, nell'idea che la frattura netta si abbia con l'America del Sud (cui apparte- 
nevano anche l'area caribico-antillana e l'istmo), con cui l'unica tenue sovrapposizione si avrebbe 
con l'intrusione chibcha in Guatemala, Nicaragua e Salvador. 

In secondo luogo, è da tenere presente che la classificazione che presento è, in tutta semplicità, 
quella che ho personalmente elaborato nel corso degli anni per schedare i miei materiali amerindi; 
quindi con finalità soprattutto bibliografiche e tematiche (almeno etnografiche e storiche oltre che 
linguistiche): qui mi sono limitato ad esplicitare le ragioni che vi sottostanno. Pure, questo risvolto 
"pratico" è un fattore nuovo: molti materiali sono costruiti (e quindi schedabili) secondo gli schemi 
sapiriani, e diverrebbero irrintracciabili se smembrati in categorie nuove; e, del pari, molte ricerche 
etnografiche o linguistico-areali pertengono a più unità filogenetiche. Naturalmente, questa classifica- 
zione pertanto non usa dati "nuovi" od originali, ma si limita a rielaborare ed a "sistemare" quelli 
preesistenti. 

In terzo luogo, è da avvisare che sono omesse quelle (forse) lingue (ahimè una lunga lista) di cui 
sono noti solo i nomi o poche manciate di parole , come ad esempio il naolan del Tamaulipas. Anche 
Golla et alii 2007, pur senza segnalarlo, si sono peraltro attenuti alla medesima pratica. 

Stante che le unità filogenetiche da considerare, per quel che attualmente se ne sa, sono quelle di 
Golla et alii 2007, bisognava distribuirle in una sistemazione accorta che consentisse di risalire facil- 
mente alle classificazioni storiche ed alla loro distribuzione geografica (areale e culturale): 



1 
2 
3 

4 



Tradizionale 

Eskaleut 

Na-Dené + 

Algonquian + 

< 

< 

< 

< 

? 

Mosan + 



Penutian 



?/Hokan 



Filogenetica pura 

1 Eskaleut (Eskimo - Aleut) 

2 Athapask (Core Athapask - Eyak) 

3 Algic (Algonquian - Ritwan) 



L. isolate 



9 

10 

11 

12 
13 
14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
24 



4 
5 
6 
7 
8 



Beothuk J (<Algic) ' 

Haida (< Athapask) 

Tlingit (<Athapask) 

Kutenai (< Mosan) J 

Cayuse | 

Chemaquan /f { (Chemakum - Quileute) 
Wakash (Kwakiutl - Nootka) 
Salisti f 

Tsimshian (Gitksan - Tsimshian) 
Sahaptian (Nez Perce -Sahaptin) 
Klamath-Molala f (Klamath - Modoc - Molala) 
Chinookan fj (Lower Ch. - Upper Ch.) 
Alsean /f { (Alsea - Yaquina) 
Siuslaw /f (Lower Siuslaw - Umpqua) 
Coosan /f (Hanis - Miluk) 
Takelman /f $ (Takelma - Kalapuyan) 
Wintuan (Wintu - Patwin) ' 

Maiduan f (Maidu - Nisenan) 
Miwok-Costano f J (Miwokan - Costanoan) 
Yokutsan f £ (Yokuts - Palewyami) 
Yuki-Wappo/t 



Genetico-Geografica 
Eskaleuto 
Athapask 
Algonkino 
"NW(Coast& Plateau)' 



California" 



Naturalmente trascurando le molte connessioni escogitate tra le due Americhe, dalle più fantastiche, come quella 
Yahgan-Eskimo di JENNESS 1953, a quelle più seriamente argomentate come l'ipotesi Maya-Yunga-Chipayan della Stark 
(cfr. Stark 1972), che pure dopo un certo periodo di favore è attualmente del tutto caduta, cfr. già Campbell 1973. 
25 II problema, endemico per il Sudamerica, è in realtà più limitato nel Nord (alcune Restsprachen, soprattutto nel SE, non 
sono però attestate molto meglio); ma già nella Mesoamerica ve ne sarebbero almeno un centinaio di casi: cfr. CAMPBELL 
1997, p. 169b. In generale, comunque, è terreno assai rischioso e su cui non giova generalizzare: cfr. ad es. CROFT 1948. 
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14 



= = = = = = = = = =3: 


i 
i 

i 
i 
i 
i 
i 
i 
i 
i 


25 Shastan /fj 

26 Palaihnihan f (Achumawi - Atsugewi) 

27 Yanan/} 

28 Pomo f 

29 Salinan /f 

30 Chumashan /|} 

31 Yuma-Cochimi | 

32 Guaicurian /} (Waikuri - Pericù) (Baja Cai.) 
L. isolate: 33 Karuk f 

34 Chimariko } 

35 Esseien } 




ii ii 


36 Washo 




— Hokan 


37 Keresan (Acoma - Cochiti) 


"SW (Pueblo 


— Uto-Aztecan 


38 Kiotanoan 




? 


L. isolate: 29 Zuni 




MacroSiouan 


40 Siouan 


"C(Plains)" 


ii ii 


41 Caddoan (Caddo - Pawnee) 




ii ii 


42 Iroquian (Cherokee - Mohawk) 




ii ii 


Isolate: 43 Yuchi 




? 


44 Adai $ 




Gulf 


45 Muskogean (Creek - Choctaw) 


"SE (Gulf)" 


ii ii 


46 Atakapan f (Atakapa - Akokisa) 




n ii 


L. isolate: 47 Natchez } 




ii ii 


48 Tunica J 




ti ti 


49 Chitimacha } 




Coahuiltecan 


50 Comecrudan /} (Comecrudo - Mamulike - Garza) 


ii ii 


L. isolate: 51 Coahuilteco % 




ii ii 


52 Karankawa % 




ii ii 


53 Tonkawa } 




ii ii 


54 Cotonarne % 




? 


55 Araname } 




? 


56 Timucua % 




? 


57 Solano } 




Uto-Aztecan 


58 Utoaztec 


Utoazteco 


Oto-Manguean 


59 Otomangue 


Otomangueo 


Mayan 


60 Maya 


Maya 


Mixe-Zoquean 


61 Mixe-Zoque 


Mixe-Zoque 


? 


62 Totonacan (Totonac -Tepehua) 


"Mexico" 


Hokan 




63 Tequistlatecan (Huamelultec - Tequistlatec) 





9 

10 

11 

12 

13 



L. isolate: 64 Seri {Sonora) 
? 65 Tarasco (Michoacàn) 

? 66 Cuitlatec f (Guerrero) 

— Mayan 67 Huave (Oaxaca) 
Hokan 68 Jicaquean f (Jicaque - Tol) (Hond.) 
Xinlenca 69 Xincan f (Yupiltepeque - Guazacapan) (Guat.) 

70 Lencan /f (Lenca - Chilanca) (Hond. - Salv.) 

- Chibchan 71 Misumalpan (Miskito - Sumu) (Hond. - Nic. - Salv.) 
? L. isolate: 72 Alagùilac } (Guat.) 

Tav. 8. La classificazione linguistica di Nord- e Mesoamerica. 

Le 72 (in verde) unità filogenetiche (58 nel Nordamerica +14 nel Centroamerica) sono state 
rapportate a soli 14 gruppi (in rosso) di cui 7 sono le famiglie genealogiche più cospicue e 7 (segnalati 
dalle virgolette "") sono i macroraggruppamenti geografico-culturali più opportuni. La disposizione è 
stata effettuata cercando di preservare il più possibile le relazioni coi raggruppamenti tradizionali (in 
viola). Naturalmente per raggiungere questo risultato alcuni compromessi sono stati necessari: il 



Guatemala-Nicaragua" 
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criterio generale è stato quello che il criterio filogenetico "comanda" sugli altri, per cui lingue 
assegnate a famiglie definite non sono poi poste nei gruppi cultural-areali ad esse pertinenti (ad 
esempio il navajo si ritroverà solo nella famiglia athapask e non anche nel "sudovest", ed il kiowa nei 
Pueblos anche se si trova nei Plains); questo spiega anche la altrimenti anomala posizione nel "centro" 
delle lingue irochesi, il cui baricentro, cherokee a parte, si trova nei Great Lakes e certo non nei Plains 
(era infatti opportuno preservare il legame, spesso postulato anche se mai davvero provato, con le 
lingue sioux e caddo). Un'altra oddity è lo spostamento ad Ovest del beothuk di Newfoundland, attuato 
questa volta solo per ragioni arbitrarie e di comodo (cioè di tipo e stato della ricerca). 

Ci si è anche sforzati di tenere un comportamento tassonomico un po' più consistente, distinguendo 
sempre lingua da famiglia (anche quando coincidono in un'unica lingua isolata). Dal punto di vista 
della nomenclatura si è provato (dimostrativamente e sperimentalmente) ad esercitarci tanto in quella 
inglese (nella colonna filogenetica) che nell'italiana (nella colonna mista); il criterio base è che si è 
cercato di usare il più possibile i nomi a derivativo zero (interlinguisticamente più spendibili), usando 
solo quando necessario quelli a derivativo pieno (inglese -ari), e ricorrendo, nel caso di famiglie 
binarie, ai nomi delle due lingue -base separati dal trattino (ad es. miwok-costano) ma eliminando il 
trattino nei nomi binari a base di nomi di famiglia, più o meno ridotti, (ad es. kiotanoan) o di shibbolet 
(stile pentite). 

Le indicazioni storico-filologiche sono affidate alla croce doppia, ||, per le estinzioni pre-1930, e 
singola, |, per quelle post. Naturalmente, nella classificazione completa tali simboli sono legati alle 
lingue, mentre nella forma schematica limitata a due livelli tassonomici sopra esibita la indicazione, 
attribuita alle famiglie, non può non diventare imprecisa: i simboli si sono apposti quando almeno un 
quarto delle lingue della famiglia hanno avuto tal sorte, e quando tutte sono estinte si è aggiunto un /. 

Neil' "onomastica" si è anche cercato di evitare nomi allusivi ad una storia troppo marcata, 
scartando designazioni come nadene (allusivo di una inclusione dello haida), ute (a favore di miwok- 
costano) o plateu penute (a favore di klamath-molala). 

5. Conclusioni. Per concludere, crediamo, pur tenendoci ai cornicioni, di avere per 

l'ennesima volta scoperto l'acqua calda, e cioè che la realtà è sempre complessa: è stupido negarlo, ma 
si possono trovare modi di fronteggiare il problema; nella fattispecie l'arte della classificazione deve 
coniugare semplicità a buonsenso, evitando comunque ogni apriorismo fuori luogo. Pare banale, ma, 
visto cosa circola in giro, forse è bene anche ribadire le banalità. 
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Per una soluzione teorica e storica dei 
rapporti tra grammatica generativa e linguistica dei corpora*. 



Se il mondo ha la struttura del linguaggio 
e il linguaggio la forma della mente 
la mente con i suoi pieni e ì suoi vuoti 
è niente o quasi e non ci rassicura. 

Così parlò Papirio. Era già scuro 
e pioveva. Mettiamoci al sicuro 
disse e affrettò il passo senza accorgersi 
che il suo era il linguaggio del delirio. 

Eugenio Montale, Diario del '71, La forma del mondo. 

Della filosofia che ne fai? Tutti vaniloqui, chiacchiere, per citare poi 
nomi insoliti Kotarbinski, Tarski, Wittgenstein, marche, sembrano, di 
pianoforti. 

Antonio Pizzuto, Ravenna, 1962, [capo 10]. 



Vent'anni fa Charles Fillmore iniziava un suo articolo con le seguenti parole: 

[...] These two [armchair linguist and corpus linguist] don't speak to each other very 
often, but when they do the corpus linguist says to the armchair linguist, "Why should I 
think that what you teli me is true?", and the armchair linguist says to the corpus 
linguist, "Why should I think that what you teli me is interesting?" [...] I have two 
major observations to make. The first is that I don't think there can be any corpora, 
however large, that contain information about ali of the areas of English lexicon and 
grammar that I want to explore; ali that I have seen are inadequate. The second 
observation is that every corpus that I've had a chance to examine, however small, has 
taught me facts that I couldn't imagine finding out about in any other way. My 
conclusion is that the two kinds of linguists need each other. Or better, that the two 
kinds of linguists, wherever possible, should exist in the same body. (Fillmore 1992, p. 
35). 

Sembrerebbero conclusioni talmente ragionevoli e di buon senso che ci si sarebbe aspettato che 
qualsiasi persona, non dico linguista, dovrebbe essersi trovato d'accordo. 

Ed invece così non fu. Come mai? 

A questa domanda 1 (ed ad altre consimili) cercherà di rispondere il presente articolo offrendo 
alcune interpretazioni e proposizioni. 



* Mi corre l'obbligo di ringraziare, per ragioni diverse, ma tutte valide, nel passato, nel presente e (spero a lungo) nel 
futuro, Alfredo Rizza, Angela Ferrari, Eva Cappellini, Federica Venier, Giorgio Graffi e Lorenzo Renzi. Naturalmente 
calanchi, dirupi e precipizi sono di mia libera elezione e responsabilità, e, se ci casco, sono solo fatti (e cocci) miei. 

Il contributo era stato presentato a Lugano il 14 settembre 2012 alle 7es Journées suisses de Linguistique. L 'empirie 
en linguistique: variété et complexité des approches. Lugano, Università della Svizzera italiana, 13-14 settembre 2012, 
organizzate dalla Société Suisse de Linguistique | "Schweizerische Sprachwissenschaftliche Gesellschaft, e ne è stato 
depositato un PDF nelVArchive della Société Suisse de Linguistique (SSG/SSL): http://www.sagw.ch/fr/ssg/ 
taetigkeiten/7e-Giornate-svizzere-della-Linguistica . html . 

1 Una via differente, ma non priva di analogie, è stata quella perseguita nell'Accademia ungherese delle scienze (MTA: 
Magyar Tudomànyos Akadémia), dove però, invece di porsi storiograficamente il problema, si è puntato, partendo dalla 
considerazione dei dati, empirici vs. intuitivi (a séguito della questione sulla (a)grammaticalità che aveva fatto esplodere 
Sampson 1987/2001: cfr. KertÉSZ - RÀKOSI 2008), alla formulazione di un nuovo modello di ricerca linguistica, il 
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Che letteralmente Chomsky abbia detto che da un corpus non si può imparare nulla, come 
spesso si riporta, è certo possibilissimo, ma almeno non l'avrebbe letteralmente scritto (od almeno 
io non ne ho trovato il luogo); però ha detto e scritto qualcosa che vi va molto vicino, come lo 
spesso citato passo seguente: 

Any naturai corpus will be skewed. Some sentences won't occur because they are 
obvious, others because they are false, stili others because they are impolite. The corpus, 
if naturai, will be so wildly skewed that the description would be no more than a mere 
list. (CHOMSKy 1962/58, p. 159). 

Ed indubitabilmente, come scrisse Leech 1991, p. 8, «Chomsky had, effectively, put to flight the 
corpus linguistics of the earlier generation». E le cose non sembrano essere molto cambiate se 
ancora nel 2004 ha ripetuto che «Corpus linguistics doesn't mean anything» (Andor 2004, p. 97). 

Sembrerebbe, quindi, non esserci molto spazio per discussioni, ma in realtà non solo la posizione 
di Chomsky è molto più articolata di quanto queste estrapolazioni facciano supporre, ma la 
chomskyana non è neppure la sola posizione esistente nel generativi smo, neanche nella 
"mainstream generative grammar". 

Ora basta constatare che non è inverosimile che si sia, specie in ambienti anglofoni, assistito ad 
una vera costruzione della linguistica dei corpora come una sorta di antigenerativismo radicale; 
posizione che ha trovato la sua storica codifica nel classico manuale di Tony Me Enery ed Andrew 
Wilson del 1996 (cfr. pp. 5-20; cito dalla seconda edizione del 2001): non vi mancano molte 
osservazioni assennate e perfettamente condivisibili, ma il generale inquadramento della vicenda in 
una opposizione razionalismo vs. empirismo da manuale di filosofia del liceo è teoreticamente 
insoddisfacente; e l'enfasi posta (posizione liminare e spazio accordatile) conduce a ridurre la 
linguistica dei corpora ad una mera risposta al generativismo, "finalmente sgombra di teorie". Come 
se ciò fosse mai possibile o comunque espediente ... 

Di altro spessore sono state le teorizzazioni di Geoffrey Sampson (soprattutto tra 1997 e 2001; 
ma, come vedremo, anche prima), in cui il richiamo alla tradizione empirista discende rettamente 
dalla lettura di Hume data da Popper (Popper 1975/72, capitolo 1 Conoscenza congetturale: la mia 
soluzione al problema dell'induzione), e come tale è metodologicamente affatto irreprensibile. 
Nonostante la caricatura che Chomsky insiste nel darne (cfr. Andor 2004, p. 97), 
epistemologicamente il ricorso di Sampson al metodo della prova ed errore ed al fallibilismo 
popperiano è altrettanto giustificabile di quello al modello hempeliano, strettamente nomologico- 
deduttivo, cui implicitamente si richiama Chomsky; ed i due modelli non sono affatto incompatibili, 
come Popper con la Logica della scoperta scientifica ben dimostra e testimonia. E come le 
argomentazioni samsoniane contro Steven Pinker, abilissimo divulgatore, ma "gridato" ed 
estremista, sono assolutamente convincenti, pure contro Chomsky lui-mème (di ben diversa statura 
e spessore) o contro ogni possibile forma di generativismo non sempre colgono l'obiettivo. 

Le ragioni vere di questa contrapposizione sono complesse, legate a più fattori, ma (almeno in 
parte) credo neutralizzabili nei fatti proprio seguendo le linee di Fillmore da cui siamo partiti. In 
buona parte questa neutralizzazione ha già, mi sembra, avuto luogo, ma questo non dispensa dal 
porsene il problema, storiograficamente e teoricamente (che è in realtà più una dittologia sinonimica 
che una reale duplicità di atteggiamenti). 



cosiddetto p-model, i cui risultati, assai interessanti e non necessariamente in contraddizione con quanto qui 
argomentato, sono esposti nel recente Kertész - RÀKOSi 2012. 

2 Per il trattamento dei forestierismi è alla proposta globale di BARBERA 2009 che ci atteniamo nel presente contributo, 
con tutte le conseguenze pratiche che ciò implica: «Tondo (invariabile) o corsivo (con plurale in -s)l Prestito non 
adattato (ma comunque accettato, fosse anche faute de mieux) o fastidioso termine straniero se non da puristicamente 
evitare almeno da porre nella quarantena del corsivo?» (BARBERA - MARELLO 2009, n. 3). 

-28- 



Un primo fattore è legato ad un fraintendimento, banale, ma assai diffuso tra i linguisti non 
generativi, che spesso si fermano al per graecum non legitur. che l'oggetto studiato dalle "due 
linguistiche" sia il medesimo (perché entrambe si chiamerebbero linguistica, sennò?). Invece un 
conto è essere interessati alle lingue come organismi storici, sociali e culturali concreti 
(chiamiamole col consueto termine saussuriano di langues), come l'italiano, il thai od il navajo; ed 
un conto è essere invece interessati alle facoltà umane del linguaggio (si intendano I-language, 
come nella tradizione generativa recente, cfr. Chomsky 2000, o grammaire generale come nelle 
tradizioni settecentesche, cui non a caso Chomsky si ricollega esplicitamente, cfr. Chomsky 1966). 
Fraintendimento che certo non va riportato alla porta dei chomskyani, che anzi, anche 
recentemente, Chomsky ha avuto su ciò parole chiarissime: 

So people want to study performance or discourse or social interactions, or national 
languages or whatever — I don't see how there could be any issue about it — study 
anything that's worth studying. However, the study of I-language is a very specific topic. 
It's the study of a language as a part of human biology, trying to find out what it is that 
each individuai has, that enables that individuai to participate in larger social 
interactions, or to perform discourse. There are no conflicts here any more than there's a 
conflict between a biologist studying the nature of bees and someone who's looking at 
the study of the way a colony of bees acts, building a hive or finding flowers. 
(Chomsky in Andor 2004, pp. 94-5). 

Ogni programma scientifico ha i suoi strumenti specifici (corpora o introspezione, inchieste 
sociolinguistiche o risonanze magnetiche, ecc.), adeguati al perseguimento dei propri fini (qui uno, 
Yl-language, là molti 4 ), che restano diversissimi, ma (giova il ribadirlo) che dovrebbero essere 
intercomunicanti: la struttura acclarata di una data lingua è materiale di experimenta crucis per 
l'uno, ma strutture cognitive universali eventualmente dimostrate esistenti possono essere un'ipotesi 
esplicativa di fenomeni singolari di lingue specifiche per l'altro. 

A questi diversi, ma ugualmente leciti, programmi di ricerca si accompagnano anche assunzioni 
filosofiche ben diverse e, queste sì, tra loro mutualmente esclusive: internismo nell'un caso (lungo 
una linea che parte da Frege 5 , ed oltre, anche se, allegedly, da Cartesio) ed esternismo nell'altro (e 
qui il principale riferimento è a Wittgenstein oltre che all'empirismo logico). Questo è un fattore più 
rilevante di quanto sembri, perché spesso tali orientamenti "prelinguistici" emergono 
inconsciamente ed a volte inaspettatamente nelle posizioni dei vari linguisti, portando talora ad 
atteggiamenti non bene razionalizzabili. Entrambe le prospettive, comunque, sono in sé sostenibili, 
anche se naturalmente Chomsky propugna un radicale internismo, mentre altri (tra cui pongo me 
stesso) ritengono che l'esternismo abbia ancora molte carte da giocare ed argomenti a favore, e 



3 Chiamare ugualmente grammatica, ad esempio ed all'estremo, entrambi i diversissimi (anche se parimenti leciti) 
oggetti della Grommar Inference (cfr. VAN Zaanen - ROBERTS - Atwell 2004) e della Generative Grommar è pura 
follia, probabilmente inevitabile, ma che non può che portare su triste chine. 

4 Che spaziano tra mille applicazioni pratiche, la Varietàtenlinguistik, le ricerche sociolinguistiche in genere, l'analisi 
della conversazione, l'analisi del parlato, e che solo in quanto concernono la descrizione della langue, che pure è un 
punto centrale, possono parzialmente coincidere. Ma anche quando si fanno sostanzialmente altre cose, e quindi non c'è 
competizione di paradigma teorico, i confronti dei risultati ottenuti dai linguisti di corpora con quelli raggiunti dalla 
grammatica generativa sono preziosi quando si tratti di interpretare i dati osservati e generalizzati (FERRARI c.p.). 

5 Si badi però, onde non generare inutili confusioni, come giustamente mi fa notare Giorgio Graffi, che: «la posizione di 
Frege è spesso qualificata da Chomsky come "esternista", nel senso che assume come nozione di base quella di 
"riferimento", cioè un'entità esterna al linguaggio, il cui rilievo Chomsky nega per le lingue naturali» (GRAFFI c.p.). 
Qui, meno idiosincraticamente, si intende la coppia terminologica internismo : esternismo come usuale nella tradizione 
filosofgica, ben riassumibile nell'ottima formulazione di Voltolini: «Taken in their simplest versions, externalism and 
internalism are the conceptions according to which, pending on the broad vs. the narrow identification of an intentional 
state, the content of such a state can legitimately be conceived only either as relational or as non-relational respectively. 
For externalists, the representational content of an intentional state depends on a reality lying outside the subject of such 
a state. For internalists, no external object or event which lies or occurs outside a subject' s brain (or at most its body) is 
relevant for the individuation of the content of an intentional state» (VOLTOLINI 1998/2002). 
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Pinternismo questioni irrisolte . Ma, appunto, di argomento filosofico e non linguistico si tratta: non 
deve "sporcare" inutilmente la discussione linguistica, altra è la sede in cui va posto. 

Una questione, poi, strettamente legata alla precedente 7 , ma invece già anche linguistica, pure 
spesso non ben compresa, è l'assoluto realismo della teoria generativa (cfr. invece Graffi 2001, pp. 
352-4), che non è un'ipotesi descrittiva ma una teoria esplicativa: è una teoria su come 
materialmente funziona la nostra mente (che in ciò abbia successo o meno è il gioco della scienza 
dimostrarlo, e non è qui pertinente) non su come la si possa al meglio descrivere. Simili 
rivoluzionarie assunzioni di solito non vengono fatte dai non generativisti, che siano più 
funzionalisti 1 o strutturalisti o computazionali: e la questione (meta)linguistica ha non poco peso 
nella diversa valutazione soprattutto dei fattori quantitativi e statistici. Ma sgombrato il campo dagli 
equivoci credo ci si possa alla fine intendere: anche accettando o meno l'argomento realista in sede 
filosofica, in sede linguistica molto può essere mantenuto saldo. 

Altra faccenda è poi che il fair play dichiarato nella citazione precedente, in realtà, non è stato 
spesso praticato dai generativisti più ortodossi e da Chomsky stesso, che anzi non è mai stato alieno 
dal ciurlare nel manico in generale e nella fattispecie. L'immagine bozzettistica dei due gruppi di 
ricerca che Fillmore dava come caricaturale vulgata opinio è infatti ripetuta questa volta seriamente 
(e ciò non giova certo alla distensione) anche nelle più recenti affermazioni di Chomsky: 

Armchair linguistics does not have a good name in some linguistics circles. A caricature 
of the armchair linguist is something like this. He sits in a deep soft comfortable 
armchair, with his eyes closed and his hands clasped behind his head. Once in a while 
he opens his eyes, sits up abruptly shouting, "Wow, what a neat fact!", grabs his pencil, 
and writes something down. Then he paces around for a few hours in the excitement of 
having come stili closer to knowing what language is really like. (There isn't anybody 
exactly like this, but there are some approximations). 

Corpus linguistics does not have a good name in some linguistics circles. A caricature 
of the corpus linguist is something like this. He has ali of the primary facts that he needs, 
in the forni of a corpus of approximately one zillion running words, and he sees his job 



Prima di tutte quella della natura pubblica del linguaggio e, correlatamente, della nozione di convenzione: che, se pur 
sollevano mille problemi, pure non sembrano in alcun modo eliminabili. Chomsky si è sempre solo limitato ad ignorare 
l'argomento di Wittgenstein contro il linguaggio privato (cfr. ad es. CHOMSKY 1992/2000), che purtuttavia rimane a mio 
parere rocciosamente ineludibile (anche il tentativo di aggiramento di FODOR 1975, pp. 55-98 non convinceva). A mia 
conoscenza, l'unica proposta che "risolverebbe" soddisfacentemente la nozione di convenzione in una prospettiva 
naturalistica è quello abbastanza recente di Ruth Millikan (cfr. MILLIKAN 1998/2005 e 2003/05), ma Chomsky ha 
orgogliosamente rifiutato anche questa zattera di salvataggio (CHOMSKY 2003) con argomentazioni che non mi sono 
invero molto chiare (e che mi sembrano sostanzialmente ammontare alla negazione che una difficoltà esista). 

7 Filosoficamente, infatti, come in molte (ma non tutte!) philosophies ofmind, la mossa di base è quella della radicale 
naturalizzazione dell'intenzionalità; mossa che notoriamente ha i suoi problemi, che non è qui la sede di affrontare. È 
questa, comunque, la ragione per cui qui ed altrove preferisco parlare di langue piuttosto che di competence; mettendo 
però tra parentesi le forti divergenze nel fondamento dei due concetti, molto (ma non tutto, come vedremo in séguito) 
linguisticamente non cambia. Anche altri aspetti variamente discussi, ed a questi strettamente imbricati, come l'ipotesi 
innatista, non sono per il nostro ragionamento particolarmente rilevanti. 

8 Più diffusamente sul realismo chomskyano cfr. STRAWSON 2003. Qui potrebbe bastare intendere "realista" almeno in 
un duplice senso: (1) gli stati mentali del linguaggio non sono più réalités psychiques (come per Saussure) o stati 
intenzionali (come da BRENTANO 1874 [cfr. pp. 115-6] in poi) ma sono "naturalizzati", come si accennava nella nota 
precedente, cioè ridotti ad oggetti biologici; (2) la grammatica generativa non si limita a darne una descrizione ma 
«costitutes an hypothesis as to how the speaker-hearer interpretes utterances» (Chomsky 1966, p. 75). Qui è la seconda 
tesi che ci riguarda. Si avverta che, peraltro, l'uso terminologico di explanatorily adequate in questo senso (cioè 
applicabile ad una grammatica generativa che «offers an explanation for the intuition of the native speaker on the basis 
of an empirical hypothesis», CHOMSKY 1965, pp. 26-7), e contrapposto a descriptively adequate, è tipico della 
tradizione generativa (a partire da CHOMSKY 1965), e può non risultare perspicuo fuori di questa tradizione. 

9 Che tali nella tradizione linguistica occidentale sono, ed è vano, nonché stupido, appiattirle ridimensionandone la 
portata storiografica. Chomsky insiste molto sulla rivoluzione copernicana attuata dal suo programma nella storia della 
linguistica occidentale, ed in ciò non esagera molto. 

10 Ben nota è la paradossale (e gustosa) affermazione di Hilary Putnam che «we could be made of Swiss cheese and it 
wouldn't matter» (Putnam 1975/73, p. 291). 
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as that of deriving secondary facts from his primary facts. At the moment he is busy 
determining the relative frequencies of the eleven parts of speech as the first word of a 
sentence versus as the second word of a sentence. (There isn't anybody exactly like this, 
but there are some approximations). (Fillmore 1992, p. 35). 

Corpus linguistics doesn't mean anything. It's like saying suppose a physicist decides, 
suppose physics and chemistry decide that instead of relying on experiments, what 
they're going to do is take videotapes of things happening in the world and they'll 
collect huge videotapes of everything that's happening and from that maybe they'll 
come up with some generalizations or insights. Well, you know, sciences don't do this. 
But maybe they're wrong. Maybe the sciences should just collect lots and lots of data 
and try to develop the results from them. Well if someone wants to try that, fine. 
They're not going to get much support in the chemistry or physics or biology 
department. But if they feel like trying it, well, it's a free country, try that. We'll judge 
it by the results that come out. So if results come from study of massive data, rather like 
videotaping what's happening outside the window, fine — look at the results. I don't 
pay much attention to it. I don't see much in the way of results. (Chomsky in Andor 
2004, pp. 97). 

La citazione precedente, però, con la sua allusione al videotaping (che molto assuona col 
famigerato "metodo audiovisivo" di tanti curricula behaviouristi) ci dovrebbe fornire anche un buon 
indizio sul perché di questi atteggiamenti: il ruolo chiave giocato dalla polemica antibehaviourista 
nella creazione della teoria generativa, tanto che echi di quella querelle continuano a risuonare 
anche quando il mondo della ricerca è ormai radicalmente cambiato. È una tesi che già ho sostenuto: 

E non è un caso, ma anzi un importante fatto nella storia della linguistica, che la 
parabola linguistica di Chomsky si apra anche, a due soli anni dalle epocali Syntactic 
Structures (Chomsky 1957/70), con una veemente (e storicamente mortale) recensione- 
stroncatura del behaviourismo (Chomsky 1959/67), impersonato in un lavoro di 
Skinner: come se, appunto, fosse proprio il behaviourismo estremo il primo vero 
nemico con cui la nascente teoria dovesse fare i conti. E, per tracciare la storia della 
linguistica dell'ultimo mezzo secolo, quella lontana recensione è, a mio parere, un testo 
che andrebbe messo più in luce di quello che di solito non avvenga: molte delle 
polemiche tra linguistica empirica (per usare l'ottima etichetta di Sampson 2001) e 
linguistica generativa riproducono in parte quei vecchi schemi, ed avvengono in realtà 
solo tra le ali più oltranziste dei due schieramenti. (Barbera 2008, p. 18). 

Ma che non è affatto inedita, già Sampson aveva acutamente notato ciò: 

The clue to the way Chomsky saddles his opponents with an obviously wrong point of 
view may lie in one of his earliest writings, which was a slashing review of a book 
about language by the American psychologist B.E Skinner. Chomsky's criticisms of 
Skinner were quite fair: Skinner confused the method of psychological research with its 
object, and suggested that because ali the researcher can observe are the stimuli that 
impinge on a person and his behavioural responses, that is essentially ali there is. 
Skinner scarcely seemed to believe in the reality of a complex mind that often leads a 
person to behave in ways that are linked only indirectly, if at ali, with the stimuli that 
recently impinged on him. Chomsky's later writings often refer back to Skinner. But to 
treat Skinner's unreasonable theories as representative of the centuries-old tradition of 
empiricist thought is a travesty. (Sampson 1997, p. 50). 

In altre parole: che da comportamenti possano inferirsi stati mentali non è affatto contro intuitivo; 
inaccettabile è che solo da comportamenti possano inferirsi stati mentali: l'errore di Chomsky è fare 
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di ogni behaviourismo un fascio, e la linguistica dei corpora ne paga le penalità. La realtà 1 è che 
dai fatti di parole raccolti in un corpus si può risalire ai loro correlati stati di langue , anche se 
certamente non tutti gli elementi di una langue saranno contenuti in un corpus: è l'uso testimoniato 
dai corpora, anzi, che fonda la langue 13 , anche se i corpora essendo per definizione finiti 14 ne 
rappresenteranno solo un sottoinsieme. 

Che è appunto la posizione, preconizzata da Fillmore 1992, dell'ala moderata (forse 
attualmente la più diffusa, ed in cui mi riconosco anch'io) della linguistica dei corpora che si suole 
oggi definire come corpus based; cui si oppone quella più intransigente, degna erede di quella 
testimoniata da Leech 1991, p. 8 (cit. infra), e normalmente chiamata corpus driven 5 , il cui più 
lucido alfiere è stato John McHardy Sinclair (cfr. almeno Sinclair 1987 e 1991). 

Ad ogni buon conto, la connessione originaria con il behaviourismo della tradizione "anglof- 
ona" (americana e britannica) è del resto stata appunto riconosciuta 7 da un protagonista come 
Geoffrey Leech fin dall'inizio degli anni Novanta: 

When did modem corpus linguistics begin? Should we trace it back to the era of post - 
Bloomfieldian structural linguistics in the USA? This was when linguists (such as 
Harris and Hill in the 1950s) were under the influence of a positivist and behaviourist 



11 Questo ed altri pochi passi sono praticamente identici con quanto ho scritto per i Dieci anni di linguistica italiana 
della SLI, ancora inedito (BARBERA 2012 i.s.). Non ne tento isolamenti citazionali perché non di vere citazioni si tratta: 
sono nati insieme e poi sono stati diversamente riadibiti in due lavori scritti pure essi in contemporanea. 

12 Un'analoga posizione è espressa da FERRARI 2007, p. 59. 

13 Altra questione, a rigore, sarebbe per le performances, che non potrebbero vantare alcun ruolo fondante sulla 
competence, che anzi, al contrario le fonderebbe. Ma questo non comporta negare che si possa, à rebours, da stati di 
performance inferire stati di competence; certo questi giocherebbero perlopiù un ruolo di controllo dei dati forniti 
dall'introspezione. Ruolo comunque poi non così secondario, visti i molti usi ed assunzioni impropri che facciamo della 
nostra competenza, come la letteratura sociolinguistica ha ampiamente dimostrato. 

Le due coppie oppositive competence and performance e langue et parole sono peraltro Luna derivata dall'altra, come 
Chomsky stesso ammette in Aspects, pur riuscendo ad essere, come spesso è suo stile, ingeneroso verso Saussure (per 
cui la langue non è certo «merely a systematic inventory of items»): «The distinction I am noting here [viz. competence 
vs. performance} is related to the langue-parole distiction of Saussure; but is necessary to reject his concept of langue 
as merely a systematic inventory of items and to return rather to the Humboldtian conception of underlying competence 
as a system of generative process» (Chomsky 1965, p. 4). Si tenga comunque conto che l'interpretazione, pur in sé 
sbagliata, che la langue fosse un puro inventario di elementi era nel 1965 ancora piuttosto diffusa: cfr. GRAFFI 2010, p. 
343. 

Data quindi la concezione metalinguistica (cfr. infra) della linguistica dei corpora ed il suo fondarsi su dei "testi' 
concepiti più come atti di parole che performances (se non nella limitata misura in cui i due concetti sono 
interscambiabili), il compito più urgente in agenda (un primo utile affondo è Venier 2007) sarebbe appunto quello di 
meglio studiare natura e rapporti di langue et parole, sia in Saussure lui-mème, sia dopo in Charles Bally (che al 
Saussure reale spesso si è sostituito; cfr. in prima istanza FERRARI 2007, pp. 61-65), sia prima nel menzionato 
Humboldt, ma non in modo generico, bensì specificamente per quanto riguarda il (sub)archetipo di tutte queste 
opposizioni (sub- perché l'Archetipo di tutti gli Archetipi è sempre, ovviamente, nel vecchio Aristotele), cioè la coppia 
humboldtiana èvépysia - è'pyov (cfr. ora le acute osservazioni di Venier 2012; su Humboldt cfr. anche il seminale e 
fondamentale CONTE 2010/1992). 

14 Anche se sono di dimensione ormai ben maggiore di quanto immaginasse Fillmore vent'anni fa: il corpus itWaC di 
Marco Baroni, ad esempio, conta ben 1.585.620.279 token: cfr. BARONI et alii 2009. 

15 Per la opposizione tra corpus-based e corpus-driven cfr., sia pure con importanti differenze, TOGNINI - BONELLI2001, 
pp. 65-100. Molto alla spiccia e grosso modo, ed un po' radicalizzando la distinzione, qui intendiamo la coppia 
terminologica nel modo seguente: corpus driven significa che tutto quello (e solo quello) che il linguista descrive deve 
essere attinto da un corpus (preferibilmente non etichettato e per pura inferenza statistica): un po' come avveniva per i 
behaviouristi stretti, skinneriani, non esisterebbero altri oggetti linguistici che quelli compresi in un corpus; corpus 
based, invece, vuol dire che gli oggetti di cui il linguista si occupa sono preferibilmente attinti dai corpora, ma possono 
provenire anche da altre fonti (e comunque quelli presenti in un corpus non sono gli unici oggetti linguistici esistenti), e 
che il modo con cui il linguista interroga il corpus non è guidato solo dalla statistica e dal corpus medesimo, ma anche 
da altre ragioni esterne (introspezione, ecc.) che il linguista può avere. 

16 Nel prosieguo, per comodità, ci riferiremo solo a questa come corpus linguistics, ricorrendo invece per ogni altra 
estensione del termine all'italiano linguistica dei corpora. 

17 Salvo poi disonoscerne la continuità con la corpus linguistics contemporanea e da lui praticata, che è sostanzialmente 
corpus based. Ma gli scheletri nell'armadio restano e sono altamente diagnostici. 
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view of the science, and regarded the 'corpus' as the primary explicandum of linguistics. 

(LEECHl991,p.8) 

È ragionevole dunque che la tradizione italiana, dove questo nesso non sussiste, e che anzi ha 
tutt' altra storia, possa sfuggire agli estremismi di questa diatriba. 

Tutt'altra storia, dicevo. Infatti Sabatini ha ripetutamente argomentato (a partire da Sabatini 

1 o 

2006 e 2007) e solidamente dimostrato che il procedimento corpus based e l'idea che la norma si 
ricavi dall'uso stanno alla base della storia linguistica italiana stessa, visto che il Dizionario della 
Crusca, che di quella tradizione rappresenta un momento fondamentale, è proprio stato costruito a 
partire da testi: il ricorso alla voce dei testi, cioè a dei particolari atti di parole, è caratteristico e di 
fondazione per la definizione della norma stessa della nostra lingua, per cui ha avuto più peso l'uso 
degli scrittori delle introspezioni dei grammatici. La nostra, quindi, è una tradizione in cui 
1 '"empirismo" anziché essere declinato all'inglese ed in versione behaviouristica è molto più simile 
alla linea wittgensteiniana (cfr. Barbera - Marello 2008) del ricorso all'uso (parole) come realtà 
fondante di ogni lingua (langue); e Saussure non diceva poi cose molto diverse. Da noi non 
dovrebbe quindi innescarsi quella miccia (anti)behaviourista che è stata fatale negli States ed 
altrove. 

Oltre ciò, io ho più volte (cfr. soprattutto Barbera 2009, Tf 2 pp. 15-27, e 2011) cercato di 
disegnare questa "linea italiana" alla linguistica dei corpora 1 , ravvisandovi non tanto un elemento 
di discontinuità e rottura come vorrebbe la tradizione anglosassone (di rivoluzione, in realtà, c'è 
stata solo quella generativa), quanto piuttosto di continuità con una diversa ma fondamentale 
tradizione: quella della linguistica filologica di fine Ottocento - primi Novecento. «Specie - dicevo 
in Barbera 2009, p. 23 - con le sue manifestazioni più strutturalmente consapevoli, in alcuni casi 
già presaussuriane: si pensi, ad esempio, da coté neogrammatico, ad un Carlo Salvioni 20 (così 
moderno ma classe 1858, e che sopravviverà a Saussure sei anni soli), o da altro coté, ad un Hugo 
Schuchardt, la cui attualità e grandezza non è ancora oggi stata appieno rivendicata», se non assai 
recentemente, specie da Venier 2012. E procedevo così a definirne la posizione, puntandone 
proprio sulla operosa "continuità": 

Ma si può, a mio parere, innovare e contribuire a costruire nuove conoscenze anche lavorando 
all'interno del solco di una tradizione: posizione che, se mi si consente il paragone extra- 
epistemologico, era stata fatta perfettamente chiara nel campo della storia della musica da Schònberg 
con il suo Brahms il progressivo del '33, il cui intento era «dimostrare che Brahms - il classicista, 
l'accademico - fu un grande innovatore nella sfera del linguaggio musicale. Che, in realtà, fu un 
grande progressivo» (Schònberg 1933/50/60, p. 60). 

Spesso si tende, infatti, a pensare il progredire di una disciplina solo nei termini di "rivoluzioni" e 
drastici cambi di paradigma di kuhniana memoria; ma in realtà ciò spesso avviene tramite un più 
lento e meno appariscente accumulo di esperienze, gradualisticamente, grazie al lento e "nascosto" 
lavoro fuori dalle luci della ribalta. 

Il ruolo della linguistica dei corpora, almeno nella nostra accezione, è un po' questo: innovazione 
nella tradizione. E se si dovesse tentare una storiografia linguistica del Novecento, è senz'altro vero 
che un ruolo di primo piano andrebbe assegnato alla rivoluzione generativa, ma accanto ad essa 



Questo naturalmente non implica che il concetto di norma abbia a che fare con alcunché della grammatica generativa, 
ma solo che nella tradizione italiana finanche la costruzione della grammatica normativa è più legata a procedure 
empiriche, corpus based, di quanto normalmente non capiti. 

19 Ed al di là della differente fondazione e della ancora maggiore antichità la linguistica dei corpora italiana ha ormai 
raggiunto una ricchezza di risultati che spesso poco ha ad invidiare alla tradizione anglofona: cfr. BARBERA 2012 i.s. 

20 E precisavo in nota: «Sulla cui produzione può oggi il lettore moderno gettare facilmente uno sguardo complessivo 
grazie alla meritoria edizione del centocinquantenario allestita dal Canton Ticino (SALVIONI 2008). Già CONTINI 
1961/72 aveva, da par suo, definito la modernità del Salvioni, ben vedendone il suo quasi strutturalismo avant lettre; 
inquadramento recentemente arricchito ed aggiornato dall'ottimo LOPORCARO 2008. E che in questo apprezzamento non 
abbia parte alcun schieramento ideologico (non ci confondano in ciò le famigerate astiose querele dell'ormai senile 
Ascoli) lo mostrano i plausi tributati al "neogrammatico" Salvioni anche dagli "idealisti" Spitzer e Terracini (cfr. 
Terracini 1922 e Spitzer 1929-30)» (Barbera 2009, p. 23). 
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esistono altre trame (linguistica storica e strutturalismo in primis) la cui persistenza è rilevante: non 
solo hanno diritto ad esistere ma possono ben rivendicare anche la loro importanza; e tra queste la 
corpus linguistics, od almeno la nostra versione di essa, potrebbe essere, appunto, il Brahms della 
situazione. 

Il paragone schònberghiano di cui sopra può anche essere spinto più in là: la grossa contrapposizione 
che segna tutta la metà dell'Ottocento tra wagneriani e brahmsiani, "giovani tedeschi" rivoluzionari 
ed innovatori e "classicisti" conservatori e tradizionalisti, è un artefatto, una montatura polemica, 
non rispecchiato dalla realtà dei fatti: e che gli stessi protagonisti di quegli anni la sopportassero 
come tale, oggi ben sappiamo dalla pubblicazione di molti epistolari (come quello di Brahms: cfr. ad 
es. AVINS 1997), da studi biografici accurati come quello di Alan Walker su Liszt, dalla migliore 
conoscenza di figure "intermedie" come Joseph Joachim Raff, oltre che dalle argomentazioni 
strettamente musicali accampate per la prima volta da Schònberg. (BARBERA 2009, p. 23) 

Parimenti, non c'è dubbio che la prima mossa di dialogo sia avvenuta proprio dal campo 
generativo italiano, con l'importante uscita di Renzi 2002, critica, certo, ma finalmente costruttiva. 
Non tutto è ancora a posto, e le critiche (spesso fondate) colgono soprattutto la pratica corpus 
driven 21 , non la corpus based da me avocata (ed oggi prevalente); ma bisogna dare atto a Renzi di 
incarnare una buona approssimazione al linguista che Fillmore vagheggiava. In apertura della sua 
Autobiografia linguistica, infatti, Renzi ben scriveva che «sono convinto, d'altra parte, che 
l'introspezione non escluda il ricorso ai corpora, come talora si crede: c'è ogni convenienza a 
integrare le due fonti» (Renzi 2000/2/08, p. 3); il che pienamente sottoscriviamo 22 . Vale dunque la 
pena la pena di scendere nei dettagli ed esaminare più minutamente le principali obiezioni 
renziane. 

In primo luogo, è irrisa la pretesa della corpus linguistics di classificare la grammatica generativa 
«tra i vari approcci "tradizionali" alla lingua» (Renzi 2002, p. 273); ed in ciò, come dicevamo prima, 
concordiamo appieno: si tratta di una errata percezione storica di certa corpus linguistics (come 
quella codificata nel manuale di McEnery - Wilson 1966), di cui avevamo anche ipotizzato le 
ragioni, ma non certo della linguistica dei corpora tutta, o perlomeno non di quella da noi avocata e 
che abbiamo, anzi, schònberghianamente, caratterizzato come "conservatrice progressista". 

In secondo, si nega che la linguistica dei corpora sia una vera «teoria della lingua indotta dall'uso 
del corpus» (Renzi 2002, p. 273). In parte ciò è vero, ma abbisogna di alcuni distinguo. È tipico di 
certa linguistica corpus driven (dove spesso serpeggia un mal compreso mito empirista), ma la cosa 
è assai diffusa anche in altri settori della linguistica moderna , il pensare di poter completamente 
fare a meno di teorie quali si voglia, bastando collezionare fatti, neanche già i "fatti" fossero 
immuni dalle costruzioni teoriche. Ciò naturalmente è falso, e quindi Renzi ha ragione. Però la mia 
linguistica corpus based ateorica certo non è (cfr. Barbera 2009, Tf 2, pp. 15-27), e quindi Renzi 
avrebbe torto. Non del tutto, però. Perché penso che, come nella tradizione generativa spesso si 
suole, sottintenda una teoria esplicativa, cioè realista, del funzionamento del linguaggio (cfr. supra, 
in nota); il che senz'altro nessuna linguistica dei corpora è, neanche la mia, avendone anzi 
rivendicato proprio il carattere rigorosamente, ed orgogliosamente, metalinguistico (cfr. Barbera 
2011/08). 



21 Non è infatti casuale la frequenza dei riferimenti a Sinclair. 

22 E la sinergia delle due imprese del Corpus Taurinense, cfr. Barbera 2008, ed ItalAnt, cfr Renzi - Salvi 2009, 
pienamente dimostrano ciò coi fatti. Quella che qui tento, infatti, non è la definizione di qualcosa che ancora non c'è, 
ma la giustificazione storiografica di quello che in Italia (a fronte di tante sciagure e vergogne pubbliche) è 
fortunatamente avvenuto e sta avvenendo. 

23 Potrà parere che mi dilunghi un po', ma penso sia utile; e poi così finalmente esaudisco una vecchia promessa che 
feci a Cino ormai 10 anni fa: meglio tardi che mai, soprattutto se col tempo maturano le nespole ... 

24 Basti pensare a tanta tipologia, il cui status epistemologico è perlomeno dubbio. 

25 Come usualmente ed esternisticamente intesi, non già i "concetti ingenui" di graffiana memoria (cfr. GRAFFI 1991); 
non si possono costruire teorie, positivisticamente, con i soli "fatti": un fatto più un fatto sono due fatti, non una teoria. 
E poi, come giustamente si chiede Crevatin 2009b, p. 7, «ma quando un fatto è un fatto, quando un problema è un 
problema?». 
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In terzo luogo, su concordanze e lemmatizzazione Renzi (cit, pp. 273-274) ha poco da ridire, 
salvo sottolinearne la discendenza da pratiche "antiche" o comunque precomputazionali; nel che 
certo concorro, solo che poi attribuisco a ciò una precisa valenza storiografica, giusta la mia teoria 
"continuista". 

È sul tagging (e quattro), semmai, che, pur riconoscendone l'utilità, nutre più perplessità (Renzi 
2002, pp. 274-5): che, in sé fondate, sono da riportare alla sua concezione realista dei fatti 
grammaticali; una volta accettata la posizione metalinguistica che ho dimostrato e storicizzato in 
Barbera 2011/08, le cose restano tali ma prendono un'altro aspetto. Anzi dalla pratica obbligata 
del POS-Tagging discendono anche delle conseguenze eticamente ed epistemologicamente positive, 
come ho mostrato in Barbera 2011 (specie il § 3, Obbligatorietà nella scelta del POS-tag), cui 
rimando. 

In quinto luogo, è sul parsing (Renzi 2002, pp. 275-6) che la situazione si fa più critica: «se 
penso a qualcuno al quale venga affidato il compito di eseguire un parsing manuale, mi assalgono 
fortissimi dubbi. [...] In realtà, come il tagging, ma più di questo, il parsing può svolgere solo un 
lavoro grosso, approssimativo. Ma mentre sono convinto dell'utilità del tagging, sono scettico 
sull'utilità di avere un corpus provvisto di parsing» (ibidem, p. 276). Sulla prima questione non 
posso che aggiungere: assalgono anche me 26 . Sulla seconda serve però qualche rettifica: la scarsa 
utilità linguistica di un parsing ideale che Renzi lamenta è forse tale per l'italiano, ma molto meno 
per lingue come l'inglese, in cui il tagging giocoforza ha da essere più sintattico che morfologico 
per servire a qualcosa, per tacere di lingue ancora più isolanti come il thai od il vietnamita. 
Comunque, anche a prescindere da questioni interlinguistiche, resta il fatto che parsing automatici 
vengono comunque fatti e, così come sono, servono effettivamente ad applicazioni pratiche di NLP 
come il riconoscimento vocale o la traduzione automatica, che (sia pure qual più e qual meno) 
funzionano nel mondo reale in cui viviamo, e che quindi non giova negare. Come mai, allora? È, 
come spesso, questione di intendersi: un conto è pensare al parsing come un'analisi accurata 
(idealmente perfetta) della struttura sintagmatica dell'albero frasale, come vorrebbe un buon 
linguista, specie se realista generativo; un conto è pensare ad una mera segmentazione in dei 
"costituenti immediati" che si è soliti chiamare, più neutramente, chunks, che possono anche non 
rivestire realtà linguistica (non essere cioè dei sintagmi) ma solo collocazionale (cioè statistica), ed 
essere "utili" in virtù della loro frequenza; il che ci conduce ai prossimi punti (sei e sette). Certo è 
che, pur attribuendo al parsing un mero valore metalinguistico, e pur messisi preventivamente 



26 Si sarebbe portati a credere che la nostra competenza dovrebbe sicuramente guidarvici senza grossi problemi, ma, 
come riporta Sampson «the wrongness of this idea was established experimentally, at a workshop held in conjunction 
with the Association of Computational Linguistics annual conference at Berkeley, California, in 1991. Natural-language 
processing researchers from nine institutions were each given the same set of English sentences and asked to indicate 
what their respective research groups would regard as the target analyses of the sentences, and the nine sets of analyses 
were compared. These were not particularly complicated or messy sentences - they were drawn from real-life corpus 
data, but as real-life sentences go, they were rather well-behaved examples. And the comparisons were not made in 
terms of the labels of the constituents: the only question that was asked was how far the researchers agreed on the 
shapes of the trees assigned to the sentences - that is, to what extent they identified the same sub-sequences of words as 
grammatical constituents, irrespective of how they categorized the constituents they identified. The level of agreement 
was strikingly low. For instance, only the two subsequences marked by square brackets were identified as constituents 
by ali nine participants in the following example (and results for other cases were similar): One ofthose capital-gains 
ventures, infact, has saddled him [with [Gore Court]]» (SAMPSON 2001/00, p. 92). Il che ci riconduce alla nostra idea 
che lo stabilire un efficiente (nel senso che possa essere eseguito senza difficoltà, in modo anche automatico, non che 
sia quello psicologicamentre vero) sistema di analisi sintattica (nel senso di parsing) sia una questione che non abbia a 
che fare tanto con la competence quanto con il costruire metalinguisticamente degli standard adeguati: stabilire, in 
questo senso, delle metriche fisse è stato il compito primario, da BLACK et alti 1991 a ROARKA et olii 2006. 

27 Ma cfr., tuttavia, le considerazioni generali di Sampson 2003, e gli apparati teorici di NEDERHOF - SATTA 2010. 

28 Od anche a dei parsing "depotenziati", cioè privati delle assunzioni forti (ed impossibili) di un parsing come lo 
pretenderebbe un generativista, e di fatto quasi equivalenti a dei chunking "potenziati", come le "collezioni 
naturalistiche" di alberi che, a mo' di botanico tassonomista, proponeva Sampson («Essentially, I was trying to do for 
the English language what Linnaeus in the eighteenth century did for botany», come dice sul suo sito, http: //www. 
grsampson.net/Contribs .html). 
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d'accordo sulla metrica della valutazione, resta che non è idealmente possibile un perfetto parsing 
automatico (e per forza, se è un effetto della statistica), ma al più delle approssimazioni ad esso di 
qualità e granularità variabili in funzione degli scopi perseguiti; approssimazioni che però possono, 
appunto, già essere più o meno utili, a seconda dei casi e degli scopi. Un buon chunking, che ha 
minore pretese linguistiche, invece è sempre anche teoricamente possibile. 

Quanto infatti, in sesto luogo, alle collocazioni (Renzi 2002, pp. 276-7), che sono storicamente 
una roccaforte della linguistica dei corpora e che hanno praticamente rivoluzionato la lessicografia 
degli ultimi due decenni, è uno dei punti in cui lo scritto renziano più abbisogna rettifiche. Se 
concordo con lui che, da un punto di vista strettamente linguistico, non esistono come unica 
categoria grammaticale, pure esistono come effetto di distribuzione statistica (cfr. Barbera 2009, H 
18, soprattutto pp. 923-5, dove la questione è stata più dettagliatamente articolata). Solo alcune di 
esse esisteranno pertanto nel nostro lessico mentale (gli idioms, forse alcune collocazioni ristrette, 
ecc.) ma altre no. Non è quindi detto (ammesso che sia sempre pratico, condizione cui pure 
bisognerebbe pensare, specie se si è, ad esempio, dediti ad una attività "applicata" come la 
lessicografia) che l'introspezione sia sufficiente a cogliere tutto quel che sarebbe utile avere in un 
dizionario . In parte ciò è connesso alla svalutazione della performance (cui abbiamo già accennato) 
attuata dai generativisti, laddove un saussuriano esalta la parole, con quanto oggi pertiene alla 
statistica. Un'altra rettifica merita l'affermazione che nell'edificazione del Vocabolario della 
Crusca il lavoro sia stato «fatto sull'introspezione e sul corpus dell'italiano scritto» (Renzi 2002, 
p. 277): come abbiamo prima detto, gli studi di Sabatini (che comunque sono successivi a quello di 
Renzi) hanno definitivamente acclarato in ciò la precedenza del testo sulla introspezione, e quindi 
dell'ho sulla norma (cfr. almeno Sabatini 2006 E 2007). 

Il che ci conduce al fondamentale settimo punto, quello sui rapporti tra la "tradizionale" 
linguistica qualitativa e quella quantitativa (e quindi, pricipalmente alla statistica), prerogativa 
normalmente considerata la vera hallmark della linguistica dei corpora . E in effetti questo un 
terreno su cui, anche teoricamente, la corpus linguistics si è spesso impegnata, giungendo talora a 
sintesi di notevole spessore come Klavans - Resnik 1996. Nonostante un sagace recupero della 
legge di Zipf (cfr. almeno Zipf 1929 e 1935/6; legge che però non è vero sia stata del tutto 
trascurata dai linguisti computazionali, cfr. ad es. l'ottima trattazione che ne dà un importante testo 
di riferimento, Manning - Schùtze 1999, § 1.4.3 pp. 23-29) Renzi (op. cit, pp. 277-9) non può che 
constatare l'irreconciliabilità della linguistica quantitativa con la generativa: e non a torto se già 
vent'anni fa Geoffrey Sampson (che dei metodi statistici è sempre stato un virtuoso ed un araldo) 
acutamente riconosceva che «One of the ideas underlying my work is that human languages, as 
grammatical systems, may be too different from computer languages for it to be appropriate to use 
the same approaches to automatic parsing» (Sampson 1992, p. 424): la metalinguisticità è, ossia, 
inerente al trattamento statistico dei corpora ed è quindi giocoforza incompatibile con una visione 
puramente realistica della linguistica. Incompatile, però, non vuol dire che la metalinguistica non 
possa servire alla linguistica; se poi si accetta la mia idea che quelli contenuti in un corpus siano 
degli atti di parole piuttosto che delle mere performances, tali risultati statistici avrebbero un valore 
ben maggiore (sarebbero, infatti, gli elementi fondanti della langue: il primum è la pragmatica ); 



29 Ormai abbastanza buone: stante i presupposti metrici di cui si diceva sopra, comunque ormai si passa la soglia 
dell'85% di correttezza: cfr. Clarck2010, pp. 336-7. 

30 O che servirebbe dire a qualcuno per insegnargli la lingua; attivittà nient'affatto secondaria se insegnare una regola è 
indissolubilmente legato al suo senso, come dice Wittgenstein nelle Ricerche: «Wo ist die Verbindung gemacht 
zwischen dem Sinn der Worte >>Spielen wir eine Partie Schach!<< und alien Regeln des Spiels? - Nun, im Regel- 
vezeichnis des Spiels, im Schachunterricht [corsivo mio], in der tàgliches Praxis des Spielens» (1.197). 

31 Corsivo dell'autore. 

32 Ma se tale qualifica viene attribuita alla linguistica generativa, forse è vero il contrario, tanto per me come per Renzi. 

33 Per una presentazione recente dei metodi statistici attuali nella disciplina, cfr. BARONI - Evert 2009. 

34 Ad un un primato della pragmatica in questo senso abbiamo già accennato supra: l'idea (fondante per ogni 
pragmatica linguistica) che la lingua sia un'azione, è stata pure ricondotta a Humboldt (cfr. VENIER2012), che così si 
troverebbe curiosamente invocato da due diverse tradizioni (generativismo e pragmatica) in consistente disaccordo tra 
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sennò avrebbero comunque rilevanza pratica nel descrivere una lingua (che anche quello serve), 
anche se non avrebbero nessuna forza esplicativa (nel senso chomskyano, ben illustrato da Graffi 
2001, pp. 352-3) e, in tutti i casi, poco ci direbbero dell' I-Language. Esiste però una possibilità ben 
più radicale, e finora mai tentata, ma non lontana come sembrerebbe dal naturalismo chomskyano: 
che non solo le regole della langue ma addirittura quelle della competence abbiano un fondamento 
probabilistico; se proprio vogliamo naturalizzare gli oggetti mentali, perché non dovremmo poi 
pensare ad una sorta di meccanica dei quanti del linguaggio? 

Ma questa è fantalinguistica: per tornare coi piedi sulla terra, direi che questa rassegna degli 
argomenti renziani potrebbe bastare per chiarificare il problema. Nell'articolo citato segue ancora 
una stringata critica dei principali tenet della "teoria standard" della corpus linguistics, molti dei 
quali abbiamo già esaminato indipendentemente qui anche noi. E visto che a quella parte ho già 
replicato punto per punto in Barbera 2009, p. 24, propongo di soprassedere. 

La cavalcata è stata ormai lunga, ma spero di avere così dimostrato che una convivenza pacifica 
delle due comunità scientifiche è ben possibile, nonostante le molte provocazioni da una parte e 
dall'altra, e che la "via italiana" la rende assai più facile. Un punto che resta da approfondire è la 
questione di langue et parole cui abbiamo appena accennato: ma quello sarà l'oggetto di un 
prossimo contributo. Qui credo di avere anche mostrato come sia possibile costruire una vera 
"teoria" della linguistica dei corpora senza cedere a troppe ingenuità e senza essere meramente 
antitetici alla grammatica generativa (oggetti, programmi e metodologie sono diversi ), che, dopo 
Saussure, è stata l'unica vera "rivoluzione" in linguistica: "innovazione nella conservazione" deve 
essere a mio avviso il motto della linguistica dei corpora, e si lascino pure ad altri le rivoluzioni; 
indispensabili, ma attenzione che anche Robespierre poi ci ha lasciato la testa. 
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Anafora e deissi in diacronia: il caso del voto* 



hàtà tueb e / ni keik tropad^ levvaDÌ 

'se arriva il pericolo, trovi tutti i sentieri'. 

Proverbio voto 1 . 

Kaì sari juèv oùv xò rode zfjg Ssiq'scog arjjuavTiKÓv, 
vò 8è ri rfjg Kavà rò bnoKsi/jevov oòaiag 

Ammonio in Cat. 48.13-49,3. 



0. Introduzione. Il soggetto del presente contributo è l'ultimo argomento scientifico di 

cui, undici anni orsono, ebbi modo di discutere con Maria-Elisabeth. Testimonia della grande 
curiosità intellettuale e dell'entusiasmo scientifico che non la abbandonarono mai, e che credo 
abbiano lasciato in noi un'indelebile orma. Anafora e deissi sono temi costanti della riflessione 
contiana, ma di solito non sono stati tematizzati in chiave diacronica. Qui, come allora, si tenterà di 
farlo a partire dai dati di una specifica famiglia linguistica: quella delle lingue baltofinniche (una 
catena dialettale, appartenente alla famiglia uralica, che, da N a S, attraversa finnico st. W ed E, 
kareliano N e S, oloneziano, ludo, vepso N C e S, ingrico W C E e S, voto W E e SW, estone st. N 
NE E e S, e livone 2 ). 

Scopo essenziale del presente intervento è dimostrare come la differenza deissi/anafora, 
determinata da Conte 1978, 1981 e 1996, non rappresenti solo una dimensione testuale legata 
all'uso pragma-retorico o pragmatico della lingua, ma sia in realtà un dato ben connesso alla 
dimensione semantica e sintattica della lingua: anzi, la distinzione fra referenzialità anaforica e 
referenzialità deittica - uso "deissi" ed "anafora", sia pur semplificando, credo pur sempre nella 
prospettiva contiana, che di fatto polarizza la sostanziale diversità dei sistemi referenziali - è in 
grado, come nel caso che analizzeremo, di agire sull'evoluzione storica delle lingue. A riprova della 
mia affermazione intendo discutere i dati del voto, una lingua baltofinnica oggi pressoché estinta , 
della regione storicamente nota come "Ingria" a sud di San Pietroburgo, il cui sistema pronominale 
confonde funzione deittica (collassandovi ogni grado di prossimità) e funzione anaforica, 
nonostante l'esistenza di due diversi dimostrativi: se, di origine BF, e kase, innovazione del voto 
relativamente recente, come peraltro dimostra il non adeguamento fonologico del pronome al 
sistema dell'armonia vocalica. Nel prosieguo discuteremo meglio origini e funzioni di questi due 



Mi preme ringraziare Federica Venier per avermi invitato a questa commemorazione, per me così importante, e Marco 
Cannello, senza il cui grande aiuto difficilmente sarei riuscito né a riprendere il filo di questo discorso, da dieci anni 
brutalmente reciso, né tantomeno a completarlo. L'argomentazione qui sarà perlopiù contenuta agli aspetti più propria- 
mente linguistici, rimandando per quelli più teorici e filosofici ad un futuro volume congiunto di Cannello e mio (à 
paraitre). 

Presentato al convegno contiano di Bergamo FU settembre 2008, questo intervento è stato quindi pubblicato in 
versione abbreviata in Tra Pragmatica e Linguistica testuale. Ricordando Maria-Elisabeth Conte [Università di 
Bergamo, 10-11 settembre 2008], a cura di Federica Venier, Alessandria, Edizioni dell'Orso, 2009, pp. 327-378. Questo 
ne è il testo completo. 

1 pericolo-? AR arrivare-?R3 così.ADV WSTRC tutto.ACC=NOM sentiero-PL.NOM=ACC trovare-PR.2. Da MÀGISTE 
1959, 137 che lo raccolse a Kattila Peenòtsa nel 1943 da Efrosenja Spiridonova (49 anni, nata a Pummala). 

2 Per una classificazione meno sommaria cfr. infra lo schema riportato in Tav. 4. 

3 Una situazione diversa ma analoga traccia per le lingue anatoliche MELCHERT 2009/7, i cui dati ben si presterebbero al 
tipo di spiegazione qui proposto (pur nella profonda differenza dei "testi" con cui tali lingue ci sono note). 

4 So da ERNITS 2006a del recente, più o meno artificiale, tentativo di creare una lingua letteraria vota basata sul dialetto 
di Jògòperà in una ortografia standard, in cui sarebbero usciti due volumi di fiabe (VK 2003 e 2004), che non ho visto. 
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pronomi: qui, giusto per iniziare, mi premeva semplicemente mostrare a grandi linee in cosa 
consista il problema del voto. 

1. La scoperta del problema: i dati di partenza. Se uno apre la grammatica di 

riferimento di Ariste 1968 (per brevità: A68), od anche la mia grammatica storica (Barbera 1995), 
che su di essa è basata, al § 68 (p. 58) trova la affermazione che «the demostrative pronouns in 
Votic are se 'this, that', kase 'this (here)', sama 'the same', mokoma 'such', kammuga 'such a', 
sesa-ma 'the very same', mokoma-sama 'the same kind'» 5 , ma se, limitandoci ai due direzionali se e 
kase, guardiamo gli esempi che ne fornisce, scopriamo che di fatto la traduzione che ne dà è, con 
l'unica eccezione dell'uso "articoloide" del se (cfr. infra § 2.3) sempre la stessa. 

La seguente campionatura (tutti in Vo.W di Kattila) raduna ed ordina per traducente aristiano gli 
esempi (testo voto e traduzione inglese) presenti nella grammatica di Ariste, come già avevo fatto in 
Barbera 1995, arricchendoli con la glossa del mio VoEG (Barbera 1994): 

se 'this/that' 
[1] leivàd^lévàti^senelé /lawaJle pantui (A68, 72) 

'the breads [PLACC=NOM] will have been putì [PS-FTPF-PL.3] on this\that [ALL] table 
[ALL]' 

se 'that' 
[2a] se eli minti (A68, 19) 

'that [DEM] was [IPF.3] mine [PERSI -GEN]' 
[2b] se eli ehtagona \ ehtagonna (A68, 32) 

'that [DEM] was [IPF.3] in the evening [ESS]' 
[2c] kui sé tép^se hakka ? (A68, 59) 

'how [QADV] [DEM] is she doing [PR-3] that [DEM] woman [NOM] ?' 
[2d] senei pàiva (A68, 21,29) 

'on that [ADES] day [PAR* 1 ™]' 

se 'this' 
[3a] se on sigà suku (A68, 19) 

'this [DEM] is [PR.3] of pig [GEN] stock [NOM] (i.e. unsuitable, good-for-nothing 

people)' 
[3b] se eli élmuinà (A68, 23) 

'this [DEM] was [IPF.3] once upon a time [ADV]' 
[3c] se be/lJlu véla naiziza (A68, 24) 

'this one [DEM] was not [NEG.3-òe-IPF] yet [ADV] married [wwnan-INES]' 
[3d] seveijavod^aka/léz (A68, 57) 

'this one [DEM] took [IPF.3] the fiour (PL)[ACC=NOM] to his wife [ALL-Px3]' 
[3e] senessà pàivàssà (A68, 26) 

'fromthis [ELAT] day [ELAT]' 

se 'the' 
[4] tsellé se tufli ke/lpàBi (A68, 27) 

'for whom [QPRO-ALL] isi the [ART d ] slipper [NOM] suitablei [PR-3] ?' 

kase 'that' 
[5a] kase i\ elÌ2 (A68, 107) 

'that [DEM] was 2 [IPF.3] the onei [ADV]' 
[5b] kase eli kotoi Kigori(à! (A68, 19) 

'<but> that [DEM] was [IPF.3] Grigori's [GEN] housei [NOM] [emphatic]' 



5 E la medesima lista è riprodotta in traduzione russa da Adler 1966, 125: «se 'stot, tot', kase '(bot) stot', sama 
'aTOTace', mokoma 'Taicoìi', kammuga 'sTaKiiìi', sesa-ma 'tot xe caMHbiìi', mokoma-sama 'TaKoiiace ». 
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[5c] kasenpàivà (A68, 21) 

'on that [DEM-INES] day [PAR^]' 

kase 'this' 
[6a] emmà esa kast sepà (A68, 21) 

'we are notbuying [NEG-PL.l PR] this arride [DEM -PAR] of clothing [GEN]' 
[6b] kasenna ta/lvenna evàd\^javod2^mahza\ kui ke/lmi, netti rubli (A68, 65) 

'this [ESS] winter [ESS] flour 2 [PL] does not costi [NEG-PL.3 PR] <more> than [CONJ] 

aboutthree [INSTRC], four [INSTRC] r<o>ubles [SG.INSTRC]' 

1 . 1 Primo abbozzo di una proposta esplicativa. Questi esempi, pur essendo forse troppo 

brevi per permettere una sicura decisione in merito alla natura del pronome dimostrativo, 
permettono di svelare la natura del problema che intendiamo affrontare. Non è tanto in questione 
una difficoltà di decisione fra interpretazione a forte dislocazione da un 'origo deittica (tipo that) ed 
interpretazioni a dislocazione attenuata (tipo this), come sarebbe in sistemi unari puramente deittici, 
ad esempio in svedese. Volendo rapidamente considerare il solo esempio [1], possiamo notare come 
in voto l'oscillazione this/that non dipenda da quella vicino/lontano, che altrimenti l'Ariste 6 avrebbe 
facilmente potuto spiegare l'uso del pronome, se non altro indicandone i modi di disambiguazione 
contestuale. Essa piuttosto dipende dal doppio uso deittico di se, per cui il tavolo indicato può 
essere incluso nel sistema referenziale interno al discorso, avendo quindi un valore di deissi 
testuale 7 , interna, oppure può trovarsi nel sistema referenziale del mondo esterno, nella situazione, 
assumendo così un valore di deissi esterna, o piena. È probabile che l'oscillazione segnata da Ariste 
nella sua grammatica sia inerente al sistema grammaticale; possiamo pensare che essa indichi che in 
enunciati come [1], in cui è pragmaticamente inconveniente disambiguare il senso del pronome 
relativo, esso assuma una sorta di valore neutro grazie a cui viene indicato l'oggetto dell' ostensione 
enunciativa senza tuttavia giustificare a quale universo referenziale appartenga, se a quello 
anaforico interno od a quello deittico esterno. 

L'oscillazione semantica di [1], che Ariste indica in traduzione col doppio pronome this/that, 
implica dunque l'esistenza di situazione neutrali, in cui il pronome si riduce ad un puro atto indicale 
non altrimenti specifico: si noti che, se la questione fosse esclusivamente deittica, sarebbe 
risolvibile, come dimostrano gli altri esempi in cui la distinzione deissi vicina/lontana è sempre 
definita. Che tale riduzione a contesti neutrali nei quali è preservato l'atto di indicazione senza 
specificare se il referente dell'indicazione stessa sia interno od esterno al sistema anaforico, se cioè 
esso appartenga al campo del parlante (anafora) o a quello del mondo esterno (deissi), dimostra che 
il sistema voto distingue fra indicalità anaforica ed indicalità deittica. 



6 Si tenga conto che la statura scientifica e culturale di Ariste è altissima, ed oltrepassa di molto quella del semplice 
dialettologo, etnologo e linguista uralico (cfr. Onga 2000, una biobibliografia, le annotazioni di Salve 2005a, nonché 
le commemorazioni di Viitso 2005 e della mostra di cui riferisce Salve 2005b), per assurgere a quello che Contini 
avrebbe chiamato "operatore culturale" tout court, il cui ruolo nella cultura europea (e nel mantenimento in essa della 
cultura estone) è stato cruciale. Basti, ad esempio, dire che è stata lui la figura che ha reso possibile lo storico incontro 
di Sebeok con Lotman nel '70 e che, soprattutto, con stratagemmi consentì a Sebeok di uscire con quella valigia di 
manoscritti che finalmente fece conoscere la scuola di Tartu al mondo (cfr. SEBEOK 1998, con peraltro un racconto 
deliziosamente vivido di quegli eventi). Ed è anche grazie agli Ariste, ed al loro paziente e nascosto lavoro, mimetizzati 
nelle grigie maglie dell'accademia sovietica, che l'Estonia deve il suo mantenimento agli standard scientifici che ne 
fanno ora, che finalmente è uscita dal giogo sovietico, uno dei centri culturali più vivi ed importanti di questa altrimenti 
stanca e scialba Europa. La donazione della biblioteca di Sebeok al Dipartimento di Semiotica dell'Università di Tartu 
(il suo trasferimento da Bloomington a Tartu è del 2006: cfr. http: //www. ut .ee/SOSE/tartu/library .htm) è in 
questo senso simbolica ed assai significativa. 

7 La nozione che presuppongo è, naturalmente, quella di CONTE 1978/88/99, § 1.1.2 p. 17: «La deissi testuale è quella 
forma di deissi con la quale un parlante fa, nel discorso, riferimento al discorso stesso, al discorso in atto, ossia a parti (a 
segmenti o momenti) deìV ongoing discourse (in particolare: o al pre -testo, o al post -testo, o, nel logicamente 
problematico caso dell'autoriferimenti, a quella stessa enunciazione, nella quale l'espressione logodeittica ricorre)»; 
nella stessa prospettiva cfr. anche Marello 1979 (spr. pp. 151-152). 
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La possibilità che si verifichino oscillazioni come quella qui discussa ci permette anche di vedere 
come avvenga il passaggio dall'uno all'altro sistema. Assumendo, per le ragioni che vedremo 
meglio più avanti, che il sistema sia originariamente anaforico, possiamo pensare che in alcuni 
contesti l'anaforicità sia bloccata a favore di un'indicalità non anaforica: in questi casi o viene 
specificato il nuovo insieme referenziale del pronome, oppure esso rimane incerto, risolvendosi, 
come accade nel nostro esempio, in un puro atto indicale che, nulla dicendo del campo di 
appartenenza del referente, permette all'interlocutore di interpretare l'enunciato determinandone il 
valore anaforico o meno a seconda del contesto. 

In Barbera 1995 avevo aggiunto altri due esempi, tratti dai testi pubblicati da Màgiste 1959, in 
appoggio rispettivamente al tipo degli ess. [4] e [3], in cui, per ragioni che saranno chiare nel 
prosieguo, non avevo trovato di meglio che glossare "anaforico": 

[6] tuJleb^viess mies I ... .1 se: mies^tùli rantàse 

'es kommt [PR-3] aus dem Wasser [ELAT] ein Mann [NOM] ... . Der [ANAF] man [NOM] 
kam an [IPF.3] (in) den (See-)Strand [ILL] ' < Kattila = Màgiste 1959, 86 

[7] esimeitii ke-rt\ kui tu-lh ma-Sina^ I svzs^U mii-oj tu-lìmmv% ka-zeÀ ma-sTnaJlJlv pretàrì 

'als 2 [CONJ] der Zug 4 [NOM] zum ersteni! Mali [ADV] kam 3 [IPF.3], da 5 [CONJ] reisten 8 
[IPF-PL.l] auch 6 [ADV] wir 7 [PERSI. PL] mit diesem [ANAF-ADES] Zug [ADES] nach 
Petersburg [ILL]' < Kattila = Màgiste 1959, 86 

2. Lo SFONDO BALTOFINNICO ED URALICO 8 . Dimostrativi (DEM), personali (PERS) e 

riflessivi (REFL) sono caratterizzati in BF, come in molte lingue uraliche, dalla compresenza nella 
declinazione di formazioni tematiche diverse; ciò è rilevante spr. nell'opposizione tra SG e PL, in 
special modo per i DEM che presentano solitamente una particolare alternanza t\s- ~ n- (cfr. infra). 

Al di là di questo fenomeno, peraltro condiviso anche da altre classi di pronomi, è importante spr. 
notare l'intreccio tra le categorie DEM e PERS. Che il pronome di terza persona (PERS3) sia 
costituzionalmente diverso dagli altri due per via della sua natura anaforica anziché deittica è 
constatazione ovvia dopo Benveniste 1956 ; orbene, nel sistema pronominale BF la casella del 
PERS3 è stata aggredita da due temi dimostrativi distribuitisi in modo speculare tra lingue 
settentrionali e meridionali, che hanno risparmiato l'anaforico originario solo nelle lingue 
settentrionali limitatamente alla categoria [+ANIM]. Una simile intrusione non è sconosciuta anche 
in altre lingue uraliche, ed anzi alcune più generali connessioni tra PERS e DEM uralici sono state 
talvolta prospettate: «nel ruolo di pronome personale di 3 a ps. in più lingue affini troviamo il 
continuatore di un precedente pronome dimostrativo (est. tema "questo" — > "lui", cer. tuSo, ngan. 
sete "quello — > "lui"; anche in finnico si impiega spesso il pronome dimostrativo se in luogo del 
personale hàn). Per conseguenza si congettura che il pronome personale di 3 a ps. nella stessa 
protolingua si sia costituito dall'originario pronome dimostrativo. Un analogo rapporto certuni 
vedono fra il pronome personale di 2 a ps. e il dimostrativo dall'iniziale t-. Una qualche connessione 
dei pronomi personali con i dimostrativi in una prospettiva più ampia appare credibile, però nel 
protouralico i due tipi di pronomi si distinguevano già nettamente fra loro» (HajdÙ 1992, 203). 

In parte del BF (nel gruppo S), inoltre, si verifica un'ulteriore frammistione, in quanto il tema 



In queste osservazioni storiche preliminari e di sfondo attingo liberamente a BARBERA 1995, che peraltro aveva 
costituito la base per le mie discussioni con Maria-Elisabeth. 

9 Le tre categorie sono intrecciate, come presto vedremo, sicché conviene fornirne uno sfondo globale. In generale, sui 
pronomi in BF i riferimenti base sono: Ojansuu 1922, Alvre 1985 e Laanest 1982, 189-203. 

10 La distinzione linguistica (che filosoficamente bisognerebbe partire dalla determinazione aristotelica della Tipcòir) 
oòaia, cfr. lo scolio di Ammonio in epigrafe) tra deittici, tra cui i PERSI e 2, ed anaforici, tra cui il PERS3, risale in 
realtà, com'è noto, ad Apollonio Discolo (cfr. ITepì Svvrà^swg, 11.83 ecc.), ed il termine demonstràtlvus stesso, 
applicato tanto ad ego e tu quanto a hic ed iste, è stato d'altra parte introdotto da Prisciano (cfr. BR0NDAL 1948, 43; 
ecc.) proprio per rendere il greco Ssiktikóc; (cfr. Institutiones, XII. 2-4 [Keil, 11.577-579] e IJspì Xuvra^scog, 1.17 
[Uhlig, 18-19 = Bekker, 12]), forse ricalcando la più frequente equazione di àmbito retorico (riferita ad un genus 
orationis) £Ki8siKxiKÓq= demonstrativus. 
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anaforico di terza persona (BF sÀ-nÀ-, cfr. il PERS3 [+ANIM] Su. hàn, < FU si: cfr. UEW, 453- 
454), altrimenti perduto a favore di un tema dimostrativo, si sposta a fungere da obliquo del 
riflessivo BF ice (cfr. Palmeos 1956 e cfr. infra); ma su questo torneremo tra poco. 

2.1 Sistemi deittici binari. I dimostrativi in BF ed in uralico (cfr. Laanest 1982, 196-200 

e spr. Manzelli 1987, 83-85) sono normalmente di tipo binario (simbolicamente 1:23), come in 
italiano colloquiale od in inglese, e non di tipo ternario (1:2:3) come in italiano letterario od in 
latino, vale a dire che le relazioni di prossimità che istituiscono sono rappresentabili 
schematicamente al modo seguente: 



Lt. 



tu 2 iste 




ikis 

1 
I 



You He 
2 3 

that 



Eng. 



Tav. 1. Sistemi deittici binari e ternari. 

Le lingue uraliche, cioè, distinguono di solito due dimostrativi di base, il DEMI 'questo' ed il 
DEM23 'quello' 11 , cfr. ad es. 12 : 





1 


23 


Su. 


tàmà 


tuo 


Ee. 


see 


too 


Lp.N 


dàt 


diet 


Mo. 


tja 


sja 


Mr.M 


tidy 


tydy 


Ko. 


tajò 


sìjó 


Ma. 


ez 


az 


Ng. 


dtnty 


tane 



Tav. 2. 1 dimostrativi nelle lingue uraliche. 

2.2 Dall'Uralico al BF meridionale: l'ipotesi storica. La storia del sistema 

pronominale balto finnico ed uralico (PERS, REFL e DEM), può essere riassunta in modo da 
coglierne immediatamente il senso globale. 



11 Per il protouralico (cfr. HajdÙ 1992, 203) si possono, tuttavia, restituire tre distinte basi dimostrative (a parte i 
rispettivi PL quando eterocliti, cfr. infra): ce (cfr. UEW, 33-4; cfr. infra Vo. se DEM), tà (cfr. UEW, 513-515; cfr. 
infra Vo. tàmà PERS3) ed e (cfr. UEW, 67-68; in BF ve ne sono tracce spr. in CONJ, cfr. Vo. ella 'se, posto che' in 
VoEG s.v., mentre come tema pronominale è noto solo nel voto di Jògòperà, dove sarà un estonismo, Ee. e Li.: cfr. 
Karelson 1959 e Barbera 1995 § 4.4.3.1.2 per discussione e bibl.), le cui ricostruzioni semantiche date da Rédei 
sono risp. 'dieser, der, jener', 'dieser' e 'dieser -e, -es'. Vi sono inoltre poche lingue nelle quali la situazione è di 
interpretazione molto meno semplice del prevedibile, come appunto (cfr. infra) il voto od il nenec (cfr. Terescenko 
1965, 890). Non sarebbe pertanto categoricamente da escludere che forse anche l'uralico abbia conosciuto in qualche 
fase remota della sua storia un sistema di dimostrativi più complesso di quello binario rispecchiato dalla maggior parte 
dei suoi moderni continuatori. 

12 Fonti: Potapkin - Imjarekov 1949, 338 (Mo.); Lytkin 1961, 884-885 (Ko.); Kovedjaeva 1966a, 246 (Mr.M st); 
Terescenko 1966, 427 (Ng.); Bergsland 1976, 58-60 (Lp.N montano occidentale in ort. Bergsland - Ruong); 
Laanest 1982, 196-200 (BF). 
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1 ì 

Si hanno in BF sette basi delle categorie che ci concernono, una riflessiva, tre personali, una 
genericamente anaforica e due deittiche. Vi sono delle divergenze in proposito delle lingue BF 
settentrionali dalle meridionali e del voto da quest'ultime. In effetti si può tranquillamente 
affermare che il voto in questo settore si presenta con una fisionomia assai peculiare. 

La tavola seguente rappresenta sinotticamente le varie evoluzioni che hanno portato a questo 
stato di cose, utilizzando il finnico come rappresentante delle lingue settentrionali e l'estone delle 
meridionali, e confrontandoli con il BF da un lato ed il voto dall'altro: 



Vo. 

Use 
erte- OBL 



E e. 

ise 
ene- OBL 




BF 

REFL *ìce- 



PERS1 *mÀ-(nV) 
PER.S2 tÌ-(nV) 
PERS3 *sÀ-fnV) 



AN"AF *se- 



DEM1 *ta-(mV) 
DEM23 *ioo- 



Su. 

Use 
Use- +sà' OBL 

mina 

sinà 

han [-AXIM] 

se [-AXIM] 

{se) 



tana 

TUO 



Tav. 3. Spostamenti nell'area anaforico-deittica e dimostrativo-personale in BF. 

Come si vede dallo schema precedente, le trafile storiche sono chiare, anche se diverse possono 
essere le ricostruzioni della catena complessiva di questi spostamenti. 

Una prima potrebbe vedere come primo anello il passaggio del PERS3 (naturalmente anaforico: 
cfr. Benveniste 1956/66/71) all'obliquo del riflessivo (estremizzando l'anaforicità in riflessività, 
per regolarizzare il paradigma del riflessivo per analogia con la più parte degli altri pronomi, che 
hanno bitematismo retto-obliquo), con movimento del DEMI a PERS3 (da valori di riferimento 
interno, nel discorso 1 , a quelli di anaforico 15 ), e varie risistemazioni dell'ANAF. In alternativa, si 
potrebbe pensare ad una catena che parta dallo spostamento del DEMI a PERS3 (come, peraltro, 
avvenuto anche in altre lingue uraliche, ad esempio in mari), con passaggio da PERS3 a REFL- 
OBL, ed ancora varie risistemazioni dell'ANAF. 

Come che sia, il nucleo centrale di tutti i mutamenti è a mio parere da ricercare nell'area latu 
sensu anaforica che è il vero cuore del problema. Se a livello superficiale l'evoluzione che colpisce 
di più l'attenzione è lo slittamento DEMI > PERS3 che coinvolge tutto il BF meridionale (cfr. 
Laanest 1982, spr. p. 189 e più in generale 189-94 e 196-200), il fattore più importante, secondo 
me, è piuttosto la posizione centrale (ma "grammaticalmente" difficile) di se nello schema, che 



13 Un'ottava base, BF *e- < UR *e- 'questo' (cfr. UEW, 67-68), non avendo continuatori pronominali, ed avendo 
lasciato (scarse) tracce spr. in alcune congiunzioni, quali Vo. = Su. ettà 'che' (cfr. VoEG s.v.), non è stata compresa in 
questo nòvero. 

14 Che i dimostrativi, di solito articolati in termini di prossimità come illustrato nel § 2.1, abbiano, accanto alle funzioni 
deittiche primarie, anche funzioni testuali è comune e ben noto, e rientra peraltro nella sfera indagata da Maria- 
Elisabeth, cfr. Conte 1996/99; in particolare «prossimità e distanza spaziale nell'uso deittico diventano, nell'uso 
anaforico, prossimità e distanza nella catena sintagmatica, nella sequenza del discorso» (CONTE 1996/99, § 1.1 p. 97). 
Circostanza, questa, che apre la strada tanto all' "indefinite/NEW-?Aw" studiato da SQUARTINI 2007 (cui rimando per le 
ulteriori indicazioni bibliografiche) quanto ai vari "articoloidi" definiti (per cui cfr. infra; per l'imprecisione delle 
etichette di "definito/indefinito" cfr. invece Barbera 1999). 

15 La plausibilità di tale passaggio poggia sull'avere le due categorie un tratto semantico comune: «hanno funzione e di 
rinvio e di connessione le forme anaforiche», hanno «sola funzione di rinvio [...] gli elementi aventi funzione di deissi 
testuale» (Conte 1978/88/99, §§ 1.0.1.2 e 1.0.2 p. 11), sia pure col codicillo {ibidem, §1.1.2.2 p. 19) che «la deissi 
testuale costituisce connessità a livello metatestuale». In altri termini «ciò che accomuna deissi testuale ed anafora è che 
sia nell'una, sia nell'altra si compie un rinvio al co-testo» (ibidem, §1.1.2.2 p. 19). 
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"grammaticalizza" il riferimento interno oltre a quello esterno, propriamente deittico, normalmente 
appannaggio della batteria dimostrativa. L'unico tratto semantico antico che è possibile individuare 
per se, infatti, è quello, generico, dell'anaforicità, o, più precisamente, di rinvio e/o connessione nel 
testo: tratto che, nonostante le diverse mutazioni cui è andato incontro in BF, è stato conservato da 
tutte le lingue BF, come covando sotto la cenere, salvo sfociare talvolta nella creazione di 
"articoloidi". Personalmente riterrei che sia stato proprio lo sforzo di meglio integrare questo 
elemento ambiguo nel sistema da un lato a determinare lo sviluppo del tratto di animatezza in Su., e 
dall'altro, a creare quegli scambi tra deissi nella situazione e deissi nel discorso (ossia rinvio esterno 
ed interno), tra rinvio e connessione nel discorso e tra rinvio anaforico e rinvio metatestuale che 
sottostanno alle oscillazioni tra DEMI e PERS3 e tra PERS3 e REFL. 

Il panorama confusissimo del voto in area dimostrativa, anche se certo peggiorato dalle 
manifeste deficienze su questo punto della documentazione disponibile, in tal caso rispecchierebbe 
una situazione per un verso più arcaica dell'estone in quanto meno ricostruita e riorganizzata, e per 
l'altro più radicalizzata, dato che si giunge fino alla perdita dell'originario DEM 12. 

2.3 Le "altre lingue" vote ed estoni. In realtà, il quadro è più complesso di quanto 

disegnato in Tav. 3 perché è la situazione linguistica medesima ad essere filogeneticamente più 
complessa di quanto abbiamo, semplificando, fin qui detto. Non solo le quattro varietà vote a noi 
note hanno origini diverse (e presentano in gradi diversi il medesimo processo di livellamento e 
ricostruzione), ma lo stesso vale anche anche per le varietà estoni oggi sotto l'ombrello dell'estone 
standard (a base settentrionale) ma in passato variamente autonome; ed i due fasci di varietà 
"originarie" sono pure tra loro incrociati. 

Una prospezione più realistica è forse lo schema filogenetico, che qui riproduco in Tav. 4, che 
avevo elaborato in Barbera 1993, incrociando le isoglosse disegnate dalla gradazione consonantica 
(cfr. la tavola 79 in Barbera 1993, 101) con i risultati delle prospezioni storiche di Tiit-Rein Viitso 
(cfr. Viitso 1978, 1981 e 1984/5; cfr. anche ora il conclusivo e dettagliato Viitso 2003b, 131-160), 
e disegnandolo in modo da visualizzare l'intreccio tra componenti filogenetiche, areali e 
sociolinguistiche. 

Si noteranno, in particolare, a fronte della relativa omogeneità del sistema voto nucleare (dialetto 
occidentale e dialetto orientale), la eterogeneità originaria del voto di Kukkuzi (di quello dei 
Krievini i dati sono troppo scarsi e malconci per consentire affermazioni decise, ma che di un tipo 
di voto periferico debba trattarsi, pare assai probabile), e, soprattutto la posizione incrociata 
dell'estone costiero nordorientale, di cui almeno una delle due varietà, il cosiddetto Alu (parlato 
nell'Alutaguse, regione storica nota anche col nome tedesco di Allentaken, nei due centri di Jòhvi e 
Lùganuse) è più propriamente una forma vota. 
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Tav. 4. Filogenesi delle varietà baltofinniche (ex Tav. 80 di Barbera 1993, 103). 

Ciò acclarato, dovremmo riuscire a porre nella giusta prospettiva le variazioni che troviamo nelle 
principali varietà "vote" ed a meglio valutare la situazione dell'estone. 

Nel voto dei Krievini (per degli esempi cfr. oltre § 4.4.4), la varietà prima attestata ('700) e 
prima estinta ('800), si ha attestato un solo dimostrativo: «Demonstrativ und zugleich als Artikel 
gebraucht ist se, sa 1 (dieser)" (Wiedemann 1871, 79). Interessante è che non sembra intieramente 
compiuta la ricostruzione delle due flessioni eteroclite del PERS3 tàmà e del DEM se, i cui plurali 
sembrano essere conguagliati («der Plural [di se] ist gleich dem von der dritten Person des 
persònlichen Pronomes»: Wiedemann 1871, 79). La situazione ricavabile da Wiedemann è ossia la 
seguente: 



Vo.Kr 


PERS3 


DEM 


NOM 


tem(m(a)) \ tam 


s\se \ sa 


GEN 


temma\à 


senti 


PAR 


tàttà 


sid \ sittà 


ADES 


tei 


sàllà 


PL 


ned(e) \ nàtt \ newe 



Tav. 5. L'area PERS3/DEM nel voto dei Krievini. 



Wiedemann non usava il corsivo citazionale. 
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Nel voto SW di Kukkuzi, la meno vota delle varietà vote, come si è spesso detto , il sistema ha 
condizioni BF settentrionali, come evidente dai lemmi di Posti - Suhonen 1980 18 : se 'se | it, the' (p. 
458), tàmà 'tàmà | this' (p. 556), nàmà 'nàmà | these' (p. 325), hà/àn 'hàn, se | he/she, it' (p. 458); 
kase pare non esistere, e mancano purtroppo le registrazioni per il plutale di se e l'obliquo del 
riflessivo. 

Per il voto occidentale, invece, già nell'Ottocento (secondo attesta il prezioso Ahlqvist 1858) la 
situazione è quella che ci è familiare. Ed affatto simile al voto occidentale è il sistema che troviamo 
nel voto orientale: se 'tot | that [se | it, the]' 19 (Kettunen 1968, 118), ne(p) 'need | these' (Adler 
1968, 20); kase 'stot | this [tàmà | this]' (Kettunen 1968, 50) e 'see | this' (Adler 1968, 22); tàmii 
'oh, oHa | he, she [hàn | he, she]' (Kettunen 1968, 146), nam/vàD 'nemad | they' (Adler 1968, 
20); izeG 'caMbiil, itse | same' (Kettunen 1968, 41, che purtroppo non attesta il tema obliquo). Il 
"voto nucleare" è così abbastanza compatto al suo interno. 

Venendo all'estone, è certo vero affermare che il sistema sia binario, imperniato sui due poli see 
'questo' e too 'quello', come fa di solito la maggior parte delle grammatiche, da quelle tascabili, 
pratiche e monolingui (come Repnau 2001, 97) a quelle di vasto respiro, scientifiche ed 
internazionali (come Tauli 1973-83, §§ 1.211 e 1.215, voi. I pp. 86-88). Però, in realtà, va detto che 
«most Estonians manage with one demonstrative-locative pronoun see 'this'» (VllTSO 2003b, 47) e 
che anche se «acceptable in Standard Estonian "too 'that' is used characteristically by South 
Estonians» (ibidem, p. 48 20 ); tanto che una specialista estone di deissi come Renate Pajusalu può 
tout court affermare che «kuna aga eesti kirjakeel omab praktiliselt vaid ùhte demonstratiiv- 
pronoomenit SEE, on ehk siinkohal sobivam rààkida demonstratiivdeiksisest» (Pajusalu 1999, § 
3.2). 

In altri termini: la completa ricostruzione binaria del sistema è avvenuta in una sola, la più 
distintiva, delle cinque varietà che compongono il sistema estone: il lòunaeesti, l'estone meridionale. 
L'estone standard è basato sull'estone settentrionale (lingua della capitale, Tallinn), ma ha eviden- 
temente assunto anche tratti meridionali (lòunaeesti era pur sempre la tartukeel, la lingua di Tartu, 
l'antica Dorpat, grande centro culturale). La distinzione Nord/Sud, sistema unario vs. binario, che 
oggi è comunque ancora avvertibile (cfr. VllTSO cit), era molto più netta nell'Ottocento e la 
descrizione che ne faceva il Wiedemann è in tal senso chiarissima: «Das gewòhnlichste, in 
Mittelehstland jetzt so gut wie ausschliesslich gebrauchte, ist se (dieser, jener), da das anders wo, 
namentlich im Dòrptehstnischen, noch gebrauchte tò (jener) wenig und kaum anders als in 
wegwerfendem Sinne gebraucht wird, wie mis tò sest teab (was weiss der, ein solcher, wohl 
davon)» (Wiedemann 1873/75, § 139 p. 429; per la situazione odierna in lòunaeesti cfr. Pajusalu 
2003). 

L'aspetto che accomuna, invece, tutte le varietà estoni (ed anche il balto finnico settentrionale, 
finnico in testa) è lo sviluppo di see come articolo od "articoloide", come noi preferiamo chiamarlo: 
«see can also refer to entities identifiable via shared knowledge or to entities only known to the 
speaker (more article-like usage)» (Keevallik 2003, 349); tendenza inoltre estesa anche al suo 
compagno meridionale: «eesti see ja too (aga ka siin ja seal) on tekstis vaga tihti samas funktsioonis 
kui artiklikeelte artiklid» (Pajusalu 1999, § 3.2). Il fenomeno è stato ben individuato e descritto da 
Renate Pajusalu (1997a, 1999) ed è ormai comunemente presentato anche nelle trattazioni di 
riferimento (come ad es. Keevallik 2003, 349); né è senza riscontri (come già notavo in Barbera 
1999, 134) con quanto avvenuto in altri gruppi linguistici, si pensi ad esempio in latino "circa 
romancum" all'iscrizione della cripta di Commodilla (e cfr. oltre § 4.4.4): 



17 Tanto che la sua originaria "voticità" è stata spesso messa in dubbio: cfr. ad es. SUHONEN 1984, ecc. 

18 Aggiungo di mio la traduzione inglese a quella finnica. 

19 II glossario di Kettunen dà i traducenti russi e finnici, Adler 1968, invece, quelli estoni: vi aggiungo di mio dopo "|" 
quelli inglesi. 

20 Per la situazione nell'estone parlato cfr. Pajusalu 1995, ed in generale sui deittici in estone cfr. Pajusalu 1997b e 
1999, specie il §3.2. 
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[8] NON/DICE/REIL/LESE/CRITA/ABBOCE (Sabatini 1966; e cfr. Aebischer 1948). 

«In addition, see is sometimes interchangeable with tema ~ ta 'he/she'» (Keevallik 2003, p. 
349), ed è stato dimostrato (Pajusalu 1995, 1997b) che la restrizione, spesso riferita, che see sia 
riferibile solo ad inanimati e ternaria agli animati non è in realtà valida. Analoghi usi si conoscono 
anche in voto: per esempi di entrambi cfr. infra § 4.4.2, ecc. 

2.4 La dura storia. Che in voto (e, in vari gradi, nelle altre realtà linguistiche confluenti 

nella Votia od a essa finitime: cfr. Tav. 4) il processo di ricostruzione si sia bloccato ben prima 
dell'attuale fase di morte della lingua è probabilmente dovuto alla sua situazione storica, culturale e 
geo-politica, di cui pur bisogna tener conto 21 . 

I contatti col russo sono assai antichi: già la Cronaca di Nestor (la Tloceecnib epeMennux nem) 
menziona i cudi (ossia i proto-voti) come vicini nel IX secolo dei russi; nel 1069 poi i voti, alleati di 
Vseslav, duca di Polock, furono sconfitti da Novgorod e presto incorporati nel granducato di cui 
costituiranno la cosiddetta eodcKan namuna, la quinta provincia vota; anche la cristianizzazione 

99 

seguì la via russa, ossia la confessione greco ortodossa . Che già nel '500 il processo di almeno 
acculturazione russa fosse molto avanzato lo dimostra la vicenda dei cosiddetti krievini (per cui cfr. 
Manninen 1925), ossia di quei voti che tra 1444 e 1448 il maestro dell'ordine teutonico di Overberg, 
in guerra con i russi per l'Ingria, deportò nei pressi di Bauska, al centro dell'attuale Lettonia: orbene, 
la popolazione locale li considerò tout court "russi", e, dato che in lettone 'russo' è krievs, li chiamò, 
con formazione diminutiva plurale, krievini. Le guerre russo-svedesi del Cinquecento, e soprattutto 

9^ 

il secolo di dominazione svedese (nemici anche religiosi!) seguito alla pace di Stolbova del 1617 
cementarono ancora di più l'identità russa dei voti, che con la Russia tornarono comunque alla fine 
della grande guerra nordica (1700-1721). La presenza "etnica" russa, con la costruzione della nuova 
capitale, San Pietroburgo, che, iniziata nel 1703, richiamerà in breve tempo un sempre maggior 
numero di popolazione slava, finirà poi con lo schiacciare ulteriormente la popolazione vota, già 
drasticamente ridotta dalla dominazione svedese . I voti, quindi, ab antiquo si trasformarono 
sempre più in etnia bilingue: il che spiega come già Ariste, negli anni '30 del Novecento, faticasse a 
trovare un parlante voto monolingue, e giustifica quella situazione di sclerotizzazione linguistica i 
cui primordi saranno da fissarsi agli inizi del XVII see. se non prima. La storia del Novecento, poi, 
nulla ha risparmiato ai voti: l'Ingria fu teatro di scontri nella I guerra, poi (1919-20) delle sangui- 
nose guerre civili seguite alla rivoluzione d'Ottobre; ed a queste seguirono ancora lo sconquassa- 
mento delle kolkhosizzazioni forzate prima, e le devastazioni dell'occupazione nazista e della 
ritirata sovietica poi. I danni furono irreparabili e porranno così crudelmente fine ad una morte 
(forse) annunciata da secoli. 

Se a questa situazione, che fa del voto un caso prototipico di atollo linguistico affogato in un 
mare che tende a fagocitarne la poca terra ferma, si aggiunge che ciò che noi chiamiamo 
unitariamente "voto" altro non è se non un insieme di almeno tre o quattro varietà dialettali 
principali, filogeneticamente indipendenti, ognuna delle quali ha esiti suoi rispetto all'originale 
sistema pronominale baltofinnico, la difficoltà ad affermarsi per un sistema ben riassestato, a 
doppio pronome, diviene quasi insormontabile. 



21 Per un quadro più ampio cfr. BARBERA 1995, § 2.3.3.2 e sottoparagrafi, pp. 61-65, e PALMEOS 1984\62. 

22 Ancora nell'Ottocento la caratteristica confessionale dei voti li accomunerà più ai russi che ai finnici: «the Votes are 
Greek Orthodox, just like the Russians and their dose relatives, the Ingrians. [...] The devotion to Greek Orthodoxy has 
brought the Votes nearer to the Russians and to the Ingrians, at the same time alienating them from the Finns, who are 
Lutherans. One indication of this may be seen in the fact that, at least during the czarist rule, the Votes normally did not 
marry Finns, but they would intermarry with the Russians and the Ingrians» (OlNAS 1955, p. 38). 

23 Questa almeno è la forma (forse mediata dallo svedese) con cui il toponimo è generalmente riferito nei manuali di 
storia occidentali; si tratta in realtà di Ctoh6óbo, un piccolo villaggio russo presso Thxbhh. 

24 Si calcola che nel 1641 la popolazione autoctona dell'Ingria ammontasse al 63%, ma che nel 1695 si fosse abbassata 
al 26,2%. 

-56- 



2.5 Sistemi deittici unari. Sistemi unari, in cui viene solo istituito un riferimento alla 

situazione, ma la precisazione del grado di prossimità è lasciata al contesto o ad altri meccanismi, 
del tipo di quello dell'estone settentrionale strido sensu, si diceva, non sono poi una gran rarità 
tipologica: ben noto è, ad esempio, il caso dell'ebraico, che ha il solo ni, normalmente reso 'questo'. 

Ma non bisogna andare così lontano: molto più vicino, ed anzi arealmente assai influente, v'è 
infatti lo svedese, che presenta un sistema affatto tipico, e che, vista la storia, può ben avere giocato 
il suo ruolo nello sbocco delle varietà estoni settentrionali (in passato nell'area di influenza svedese) 
verso un sistema unario e del lòunaeesti e del livone (in passato nell'area di influenza tedesca) verso 
un sistema binario. 

Lo svedese, infatti, presenta sostanzialmente una sola forma, peraltro coincidente con il 
cosiddetto articolo determinativo preposto , disambiguabile dal punto di vista della prossimità o 
dal mero contesto o dalla presenza delle espressioni localizzanti hàr : dar: 



den (det, de) 


'questo/quello/il' [usuale] 


denne (denna, detta) 


'questo/quello' [solo formale e scritto] 


den hàr 


'questo' [lett. 'questo qui'] 


den dar 


'quello' [lett. 'questo lì'] 



Tav. 6. Il sistema dimostrativo in svedese. 

3. Note storico-comparative e morfologiche. A giustificazione di ciò aggiungo 

poche note etimologico-storiche sulle principali basi coinvolte, abbinandole a quel minimo di 
informazioni morfologiche necessarie. 

3.1 Morfologia e storia del BF *se > Vo. SE. Se, il dimostrativo probabilmente più 

frequente in voto, corrisponde, come s'è ripetutamente detto, da un lato all'Ee. see 'questo' e 
dall'altro al Su. se 'esso, il'. 

Etimologicamente risale alla base pronominale UR [BF + MD + MR + XA + SA] ce, il cui 
tratto primario era probabilmente quello dell'anaforicità (cfr. supra per il BF), che sembra essere il 
solo comune denominatore semantico sottostante le forme delle lingue moderne che valgono 
alternativamente 'questo' o 'quello' od entrambi 26 (Paasonen 1906a e 1918, 12-3; Alvre 1963 a). 
Il tema BF se- ( < FL ce-) ha un allomorfo (che si alterna nella flessione e nei DER) sl\i- di origine 
non chiara (cfr. Laanest 1982, 196-200 con bibl.): nella maggior parte delle lingue (tranne in Ee. e 
lEe. dove è generalizzato) il tema in -e ricorre al NOM ed al GEN, mentre il tema in -i è 

97 

caratteristico degli altri casi obliqui e della maggior parte dei derivativi ; il voto odierno ha però 
generalizzato il tema del GEN anche per gli altri casi obliqui, nonostante le forme più brevi in -i 



25 In svedese l'articolo determinativo è normalmente enclitico (cfr. ett finger 'un dito' vs.fingret 'il dito'). Il cosiddetto 
articolo determinativo preposto è di uso assai limitato, normalmente come antecedente del relativo som (specie nella 
forma den som 'colui che') o del complementatore att 'che'; si noti, inoltre, che le normali relative attributive prendono 
l'articolo enclitico, e solo le restrittive il preposto, cfr. ess. [9] (da Gravier - Nord 1968, p. 58): 

[9a] Poikarna, som aldrig hade skolkat, fick en belònig 

'i ragazzi, che non hanno mai marinato la scuola [interpretazione attributiva], riceveranno un premio' 
[9b] De poikar, som aldrig hade skolkat, fick en belònig 

'(solo) i ragazzi che non hanno mai marinato la scuola [interpretazione restrittiva] riceveranno un premio' 

26 Si veda ad es. la situazione, in questo tipica, delle varietà xanty: cfr. (da Karjalainen 1948, 895ab) Xa.E Vx ti 'tuo 
tuossa | der dort' ^ t'if 'tàmà, stot' | dieser' vs. Xa.N Kz sit - si 'tuo tuossa, tàmà (etempànà kuin tèmi) | der dort, dieser 
(weiter weg als /.)'. In BF, inoltre, la forma *-sen < *-sÀ-nÀ era utilizzata come desinenza verbale riflessiva ( > 
mediale), uso che si riflette nel presente sigmatico estone meridionale (cfr. Barbera 1995 § 4.6.1.1.1.2), nella 
coniugazione riflessiva vepsa (cfr. BARBERA 1995 § 4.6.1.1.1.4), nella marca personale della terza persona SG 
dell'imperativo (cfr. Barbera 1995 § 4.6.2.5) e nel passivo (cfr. Barbera 1995 § 4.6.4.1), e che è ben coerente con la 
postulata natura anaforica della base di partenza. 

27 Cfr. ad es Su. siità - Vo. sita - Ee. siit 'donde' antico ADV PAR con valore separativo (cfr. VoEG s.v.). 
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fossero ancora date come normali da Ahlqvist 1856 e sopravvivano limitatamente in qualche 
dialetto od in arcaismi lessicalizzati come ADV. 

Caratteristicamente per questo tipo di basi il PL ha invece un tema in nasale, neD che tuttavia, a 
differenza del SG riconducibile all'UR, non sembra possibile rintracciare (e dubbiosamente) oltre il 
FV [BF + LP? + MR??] (cfr. SKES, 370a-lb), dal momento che i corrispondenti in Ko. proposti 
dallo SKES sono meglio comparabili (cfr. KESKJa, 193a) con il Su. nuo PL di tuo 'quello' e le 
altre forme relate. 

Nella tavola seguente, raccogliendo tutte (e solo) le forme attestate nelle mie fonti primarie , 
presento la declinazione del DEM Vo. se; dato il notevole politematismo presentato da questo 
paradigma vi aggiungo a confronto le corrispondenti forme finniche (che appartengono tuttavia al 
PERS3 [-ANIM] !) ed estoni ; le forme ottocentesche ancora normali per Ahlqvist sono 
contrassegnate da un otto in esponente e quelle avverbiali da una A sempre in esponente, tra 
parentesi quando l'uso avverbiale non è predominante. 





Vo.W 


Su. 


Ee. 


NOM 


se 


se 


see 


GEN 


sene 


sen 


selle 


PAR 


. .. 8A -, -30 

sita sita 


sita 


seda 


INES 


senezà \ (sinà) 


, ■■ »x31 

(sima) 


selles \ ses 


ILL 


( 'sihé 


siihen 


sellesse \ (ses se) 


ELAT 


senessà \ (sita) 


(siità) 


sellest \ sest 


ADES 


Q 

senellà \ sella \ siila \ silà 


siila 


sellel \ sei 


ALL 


Q 

senele \ selle \ siile \ sile 


siile ' 


sellele 


ABL 


seneltà \ seltà \ siltà 


siltà 


sellelt \ selt 


ESS 


8A - -32 

sena 


sinà 


sellena 


ABES 






selleta 


TRSL 


senessi 


siksi 


selleks \ seks 


TERM 


( 'sihéssà 




selleni 


COM 






sellega 



Ossia pprincipalmente dal VoEG. Particolarmente lacunoso è spr. il paradigma PL che ho potuto ulteriormente 
arricchire solo col PL-ILL tratto da LAANEST 1982, 198; mi sono naturalmente astenuto dal ricostruire a tavolino 
(esercizio peraltro non particolarmente difficile) forme inattestate. 

29 Risp. da Lehtinen 1963, 548 ed EelS, civ N° 426 (cfr. anche Lavotha 1973, 49). Per un quadro dettagliato delle 
altre lingue BF cfr. Alvre 1963 a. 

30 sita e sinà oggi sono usati principalmente come avverbi; nella grammatica di AHLQVIST 1856, dove erano dati come 
d'uso ancora corrente, venivano rianalizzati come risp. ELAT ed INES (pratica questa seguita anche da Ariste e 
risalente con ogni verosimiglianza alla tradizione grammaticale finnica, cfr. infra), anche se si tratta ovviamente nel 
primo caso di un PAR che ha conservato l'antico valore di SEP e nel secondo caso di un ESS che ha subito un 
particolare spostamento semantico. Questi due fenomeni devono probabilmente essere antichi, in quanto sono 
perfettamente rispecchiati dal finnico dove ELAT ed INES sono rimpiazzati da due forme di PAR ed ESS distinte dalle 
normali solo per il tema in T lunga: nella tavola ho evidenziato l'uso diacronicamente improprio delle etichette 
tradizionali nella grammatica finnica di ELAT ed INES per queste due forme ponendole tra parentesi tonde. 

31 Cfr. n. prec. 

32 Cfr. n. prec. 
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Vo.W 


Su. 


Ee. 


PL 


neD? 5 \ néD 


ne 


need 


PL-GEN 


ninne \ nennì \ nennijé 


niiden \ niitten 


nende 


PL-PAR 


nìtà 


niità 


neid 


PL-INES 


nizà 


niissà 


nendes \ neis 


PL-ILL 


nìsè 


niihin 


nendesse \ neìsse 


PL-ELAT 




niistà 


nendest \ neist 


PL-ADES 




nììllà 


nendel \ neil 


PL-ALL 




niille ' 


nendele \ nei le 


PL-ABL 


mltà 


niiltà 


nendelt \ neilt 


PL-ESS 




niinà 


nendena 


PL-ABES 






nendeta 


PL-TRSL 




niiksi 


nendeks \ neiks 


PL-TERM 






nendeni 


PL-COM 






nendega 



Tav. 7. Paradigma di BF *se- (*ne-) in Vo., Su. ed Ee. 

3.2 Storia del BF *kas , morfologia e storia del voto rase. Il dimostrativo secondo 

per frequenza, kase, è una creazione autonoma del voto (cfr. Alvre 1963a ed A68, 58-59). Si tratta, 
come denunciato dalla originaria mancanza di armonia vocalica (sono comunque noti anche 
doppioni armonici secondari), di un composto relativamente recente, anche se ormai opaco, 
costruito con il medesimo tema dimostrativo di se (cfr. supra) preceduto da un elemento 
presentativo di origine verbale, kas 'guarda !', del quale esistono per altro verso in voto solo 
poche tracce 35 , derivato (cfr. Laanest 1982, 196 ed Alvre 1985, 161) dall'imperativo di un verbo 
significante 'guardare' ( < FP kace- 'sehen, blicken, bemerken' UEW, 640; — SKES, 171a e 
KÈSKJa, 114b-5a) non attestato in voto ma rispecchiato da Su. katsoa 'guardare': in Su., d'altra 
parte, si è regolarmente avuta l'evoluzione katso 'guardare-IMP.2' > kas ! 'veh!, guarda!' INTJ. 

La declinazione di kase non riserva molte sorprese rispetto a quella, esaminata nel paragrafo 
precedente, di se; la tavola seguente raccoglie, comunque, tutte le forme attestate nel VoEG, tra cui 
è interessante notare la frequenza di allomorfi (più o meno subdialettali) con restituzione 
dell'armonia vocalica di norma assente: 



33 Ariste 1968 e Adler 1966 danno vocale breve, ma Tsvetkov 1995 ed in genere tutti i testi voti che conosco la 
lunga. 

34 La struttura di questa formazione sembra in qualche modo analoga a ben note evoluzioni romanze del tipo di Fr. celui 
ecc. cfr. DÉLF, 115b-6a; Lausberg 1976, 11.136-140; ecc. 

35 Cfr. ad es. l'interiezione, che Ariste qualifica come esprimente «threat», kà-kà I: cfr. VoEG s.v. 
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SG 


PL 


NOM 


kase \ kase \ kas 


kane \ kane \ kaneD 


GEN 


kazé \ kazé 


kanejé \ kanejé 


PAR 


kasta \ kast 


kaneita \ kaneita 


INES 


kazeza \ = ESS 


kaneiza \ kaneiza 


ILL 


kasèsè \ kassè \ kasèsè 


kaneisè (da Laanest 1982, 198) 


ELAT 


kazessa \ kazessa 




ADES 


kaze/ì/ìa \ kaze/ì/la 




ALL 


kaze/ìè \ kaze/ìè 




ABL 


kaze/lta \ kaze/lta 


kanei/ìta \ kanei/ìta 


ESS 


kasenna \ kasenna \ kaseh 




TRSL 


kazessì \ kazessi 





Tav. 8. Paradigma di kase in Vo.W. 

3.3 BF *tà-mA ecc.: origini uraliche e sopravvivenze in voto. Il corrispondente voto 

del DEMI finnico tàmà è il PERS3. Sono tuttavia attestati pochissimi esempi anche in voto di tàmà 
usato come dimostrativo; nel corpus del VoEG vi sono solo i seguenti due: 



[10a] 



[10b] 



(A68, 21) 
(A68, 76) 



36 



tàmà naìzìkko on toz soìkko/laìsi 

'this [DEM] woman [NOM] is [PR.3] also [ADV] a Soikkola Ingrian [PL.PAR]' 

kuhè tata huJlJlua véD ? 

'where [QADV] <is> that [DEM-PAR] fool [PAR] to be taken [PR-2 per PS]' 

Data l'esigua consistenza del fenomeno credo più probabile che si tratti di un calco sul finnico 
od eventualmente sull'ingrico piuttosto che di una conservazione del valore originario della forma 
in questione. 

In voto come in tutto il BF meridionale, come s'è detto, fa le veci del PERS3 l'originario DEMI 
BF tà-mA (conservato come tale in BF N), un tema di origine uralica con caratteristico plurale 
alternante ( tà- SG ~ nà- PL), e con un derivativo anch'esso uralico. 

Il PERS3 SG Vo. tàmà risale, infatti, all'UR *tà- 'questo' (cfr.: UEW, 513-515 [*tà (~ *te ~ *tì) 
'dieser']; FUV, 62 e 146; KÈSKJa, 277a; MaSzFE, 622-3 [ tà]; TESz, III.910b-lb [*tà\, SKES, 
1478a; UrlG, 322). 

In Vo. ed in BF oltre al tema nudo tà-, originariamente usato per i casi obliqui (dove è stato 
talvolta rimpiazzato per analogia con forme ricostruite sul NOM) e per molti derivativi avverbiali, 
si conoscono principalmente tre temi ampliati, formati con tre derivativi. 

Il tema ampliato più importante è tà-mA-, che appariva originariamente in tutto il BF al NOM 
ed al GEN\ACC, ma che in Vo. è stato esteso analogicamente anche a qualche caso obliquo. Il DER 
- mA ha anch'esso, come si è accennato, origini assai antiche, TUR - mV (cfr.: UEW, 514 e spr. 
MaSzFE, 623; potrebbe forse essere connesso con il tema del QREL, Vo. mikà, cfr. infra), ed anzi 
l'intera formazione tà-mV- sembrebbe essere riconducibile all'età uralica, in quanto è attestata 
anche in xanty, cfr. Xa.N Ob tàmr = E Vj tèmi' = S Di tàmì 'tàmà, stot' | dieser' (cfr.: 
Karjalainen 1948, 999b-1000a), ed in SA N, cfr. Ne.T Ob fqm* 'dieser, sieh dieser, sieh hier' e 
Ne. st. ììihm" 'Ha (eo3bMuY (cfr.: risp. Lehtisalo 1956, 500a e Terescenko 1965, 701a). 

Il secondo tema ampliato che si riscontra in Vo. è tà-kà-, che è ristretto in BF a pochi DER, 



Una cui varietà era comunque presente nell'originario sistema ecolinguistico dell'Ingria, prima che questo venisse 
tragicamente e definitivamente sconvolto dalla storia, che con questa regione non è certo stata magnanima (cfr. § 2.4). 
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come ad es. tàtsàlein = Su. tàkàlàinen '(abitante) del posto, locale' < tà-kà-lA-inen~ise- e tàllà = 
Su. tààllà ADVabl 'da lì donde' < tà-kà-ltA (cfr. VoEG s.v.), ma che si riscontra anche in MD, cfr. 
in Er. il DEM mene 'stot, HMeHHO stot, stot xe, tojibko stot' (ErRusS, 214a). Si tratta dello 
stesso DER - kA con cui sono costruiti anche i temi ampliati si-kà- e mi-kà- risp. dell'ANAF e del 
QREL [-ANIM] 37 ,. 

Il terzo tema che ci concerne, tà-nà-, è anch'esso limitato agli sviluppi di alcuni Cx avverbiali, 
cfr. ad es. l'ADV E ss Vo. tànànnà 'oggi', e ad alcuni DER, cfr. ad es. Vo. tànàvein ~ Su. 'd'oggi, di 
giornata' < tà-nà(-vA)-inen~ise-. Si tratta dello stesso DER - nA (cfr. LAANESt 1982, 189) che si 
trova anche nei personali propri (cfr. Barbera 1995 § 4.4.1.2) derivato da UR -nV. Anzi, la stessa 
combinazione tà-nV potrebbe essere uralica perché è attestata in selkupo, cfr. Sk. fina 'jener, das; 
dieser' (MaSzFE, 623). 

Anche il PL del PERS3, Vo. nàmà, è di origine uralica: cfr. il tema UR [BF + ?LP + MD 
+ MR + PE + UG + SA] del DEM.PL *nA- 'questi' (cfr.: SKES, 412b, UEW, 300 [FP \ ?UR *nà (~ 
ne ~ Ini) 'dieser; ?der, jener']; FUV, 38; KÈSKJa, 185a; MaSzFE, 470-2 e 464-6). 

3.4 Le atre basi. Oltre alle forme principali che abbiamo esaminato, va ancora menzionato 

sama 'idem', che ha corrispondenti praticamente in tutto il BF (cfr. ad es. Su. sama ed Ee. sama, 
entrambi con lo stesso significato), e che viene regolarmente declinato come i nominali della 
medesima classe tematica (Vo. d.III). 

Si tratta di una innovazione BF dovuta, piuttosto scopertamente, ad un prestito germanico cfr. 
SKES, 959ab e VoEG s.v.): cfr. aNr. samr 'derselbe; zusammenhàngend; geneit (poet.)' (aNEW, 
461b-2a s.v. sama 'geziemen, passen') < IE somos (IEW, 904a; cfr. GED, 295a [ somo- 'same']; 
cfr. KEWal, III.437 con differenti ipotesi e bibl; cfr. DÉLG, 800ab) 

Ariste elenca, infine, alcune altre formazioni dimostrative secondarie, costruite con elementi che 
abbiamo già presentato o con un'altra base BF, moko- (cfr. SKES, 346b) non altrimenti attestata in 
voto (ma cfr. Su. moinen < mokoinen così glossato dal SuEnS s.v. 'such, like that, such like; like, 
equal; similar'). Tranne mokoma, che ha perfetta corrispondenza in finnico, sono in genere tutte 
creazioni individuali del voto. 

Avendo già investito troppo spazio per le altre, mi limiterò a fornirne l'elenco con i traducenti 
inglesi di Ariste (A68, 58-59) ed una etimologia sintetica (dove è importante cogliere le componenti 
se e kas che più ci interessano): 



mokoma 


'such' 


< moko- + - mA 


kammuga 


'such a' 


< kas + moko- 


mokoma-sama 


'the same kind' 


< mokoma + sama 


se-sàma 


'the very same' 


< se + sama 



Tav. 9. 1 dimostrativi secondari in voto. 

3.5 Cenni sui riflessivi. Nelle lingue uraliche si ricostruisce un tema riflessivo solo 

limitatamente al FP ici, che risale verosimilmente ad una parola FU per 'anima', FU ic\si. 

# 

In BF ice è conservato da tutte le lingue, ma nelle lingue meridionali, come avevamo visto, si 
instaura un tema obliquo suppletivo derivato dall'originario anaforico di terza persona. In voto il 



37 Cfr. Barbera 1995 resp. §§ 4.4.1.2 e 4.4.3. Dall'altro tema dimostrativo, l'ANAF *se\i-, sono anzi tratti i due es. 
perfettamente collimanti strutturalmente e semanticamente con sitsàlàin e siàltà, cit. da BARBERA 1995 in n. al § 4.4.1.2. 

38 Si tratta dello stesso suffisso derivativo -*mA che compare anche nel PERS3 (<DEM1) tàmà, risalente ad un UR. - 
*mV(cfr. UEW, 514 e MaSzFE, 633), per il quale cfr. BARBERA 1995 § 4.4.1.2.4. La medesima formazione (cfr. SKES 
347a ed Alvre 1985, 160) si incontra in tutte lingue BF tranne estone e livone. 
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riflessivo (cfr. A68, 55-56) ha pertanto la medesima formazione che ha in Ee., in lEe. ed in Li. 
l'originario tema REFL ice, cioè, è conservato al solo nominativo ize- , mentre all'obliquo si è 
sostituito il tema del PERS3 non altrimenti attestato in voto; il tema obliquo ene- del voto, risale, 
come s'è ripetutamente detto, al tema dell'anaforico di terza persona, BF sÀ-nà-, conservato nelle 
sue funzioni originarie solo in BF settentrionale. 
Bastino pochi esempi: 

[11] mia vetan marj ad enei (l) e (A68, 55) 

'I [PERSI] take [PR-1] theberries [PL.ACC=NOM] for myself [REFL-ALL] ' 

sono abbastanza frequenti le strutture reduplicate "REFL.NOM + REFL-Cx", come in estone, e 
quelle enfatiche "PERS-Cx REFL.NOM", cfr. ad es. 

[12a] tàmà pettelebjze entà (A68, 56) 

'he\she [PERS3] is deceiving [PR-3] herselfMiimself [REFL.NOM REFL-PAR]' 

[12b] mii ize enellà on vana àmmà koton (A68, 56) 

'I [PERS1-ADES] myself [REFL.NOM REFL-ADES] have [èe.PR.3] an old [NOM] 
mother (DIM) [NOM] athome [ESS]' 

sicché il NOM è di fatto più frequente di quello che non si supporrebbe. Inoltre, sono ancora 
relativamente attestate fomazioni di REFL+Px, anche se la consapevolezza della funzione dei Px 
«has become lost, so that only the third person suffix is used for ali persons» (A68, 56), pur essendo 
ancora note sporadiche costruzioni etimologiche, cfr. 

[13a] vetan enelleni\ enelléz (A68, 56) 

'I take for myself [REFL-ALL-Pxl]' 
[13b] tsàùsi enelléz i_naissa2 ettsimài, (A68, 56) 

'he went [IPF.3] (repeatedly) to look for 3 [INF2] a wife 2 [PAR] for himselfì [REFL-ALL- 

Px3]' 

3.6 I personali dall'uralico al BF. Caratteristiche frequenti dei personali nelle lingue 

uraliche in genere sono, come s'è accennato, la formazione di SG e PL con temi derivativi diversi 
(ed una certa molteplicità di temi derivativi si riscontra anche altrove nei paradigmi spr. BF), e la 
frequente differenziazione della terza persona che può giungere alla sostituzione con un tema 
dimostrativo in alcune lingue (ad es. in parte del BF, compreso il voto, ed in MR). 





Vo.W 


Su. 


Lp.N 


Lp.E 


Mo. 


Mr.M 


Ko. 


Ud. 


Mn.N 


Ma. 


Ng. 


Sk.N 


1 


mia 


mina 


man 


Mynn 


MOH 


MblHb 


Me 


MOH 


OM 


én 


M3H3 


Mam\ti 


2 


sia 


sinà 


dàn 


móHH 


moH 


niblHb 


ms 


mon 


nan 


te 


mBH3 


mam\n 


3 


tàmà 


hàn 


san 


COHH 


COH 


nibldbl 


ciùò 


co 


mae 


ó 


C bimbi 


man 


1DL 


- 


- 


moai 


- 


- 


- 


- 


- 


Men 


- 


MU 


M3 = PL 


2DL 


- 


- 


doai 


- 


- 


- 


- 


- 


H3H 


- 


mu 


TO3 = PL 


3DL 


- 


- 


soai 


- 


- 


- 


- 


- 


man 


- 


cbimu 


manceKbiH 


1PL 


mò 


me' 


mii 


MUÙÙ 


MUHb 


Ma 


MU 


MU 


MOH 


mi 


MblH 


M3 


2PL 


to 


te' 


da 


muùù 


niUHb 


Ma 


mi 


mii 


nan 


ti 


mbin 


ma 


3PL 


nàmà 


he' 


sii 


CblÙÙ 


CUHb 


HÙHbl 


Haùò 


cooc 


man 


ók 


CbimblH 


mdHum 



Tav. 10. 1 personali nelle lingue uraliche. 
Ad illustrazione di ciò, lo specchietto precedente fornisce una schematica esemplificazione dei 



Cfr. ad es. il paradigma estone (da Eels, cv N° 433, con aggiunte le marche di lunghezza secondo il sistema che 
avevo devisato e spiegato in Barbera 1993): ise NOM, enese \ en:da GEN, ennast \ en:d PAR, enesesse \ emdasse ILL, 
ise PL, eneste \ en:di PL-GEN, en:did\ enidaid (neologismo) PL-PAR, enestes \ enidis \ emdais (neologismo) INES. 
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personali nelle lingue uraliche : 

Le ricostruzioni in proto-uralico sono abbastanza solide per il SG, in cui si restituisce, al di sotto 
dei vari derivativi, -mÀ, -tÀ e (solo FU!) -sÀ; pare invece difficile ricostruire con buona sicurezza 
gli altri numeri (cfr. HajdÙ 1992, 203 ecc.), anche se rimandano certo a differenti formazioni delle 
medesime basi; nel prosieguo ho adottato la convenzione seguita da Rédei nell'UEW di ricostruire 
le basi PL uguali al SG, intendendosi le diversità dovute a ragioni suffissali da chiarire (se e quando 
possibile) caso per caso. 

Non mancano tuttavia proposte diverse, quali quella 41 di pensare che il SG fosse distinto (almeno 
per le prima due persone, sole ricostruibili in UR; ma anche per la terza persona BF, LP e MD 
sembrano conservarne vestigia) dal suffisso -nÀ di cui ritroviamo in effetti tracce nella 
maggioranza delle lingue della famiglia. 

Per la formazione dei PERS in BF cfr. in generale Laanest 1982, 189-94. In particolare si noti 
che in BF i PL erano probabilmente distinti dal pluralizzatore k (cfr. Barbera 1995 § 4.2.2.1), 
anche se tale caratteristica sembra persa nella maggior parte delle lingue odierne, comprese alcune 
come il Vo.E e l'In.E che di solito conservano -k finale , cfr. ad es. BF me-k 'noi' : 



Su. 


Ka.-Ly. 


Ve.N 


CW 


CE 


S 


In.E 


C 


W 


S 


Vo.W 


E 


Ee. 


lEe. 


Li.W 


E 


Sa. 


mé'^ 


mùò 


ino 


mii 


mò 


me\ò 


mò 


mò 


mùò 


miX 


mò 


miX 


me 


mi' 


meG 


meG 


me/e 



Tav. 11.1 personali di prima plurale nelle lingue baltofinniche. 

Il voto non presenta significative divergenze nei personali dalle altre lingue meridionali 
caratterizzate dalla sostituzione dell'originario PERS3 con il DEMI BF tà-mA. 

In generale i PERS presentano in voto (come anche nelle altre lingue BF) una discreta varietà di 
alternanze tematiche (cfr. ad es. per il PERSI mi-, mia, minu-, mo e me-) dovuta oltre che 
all'evoluzione fonetica alla sovrapposizione nel paradigma di diversi temi derivativi. 

Un'interessante caratteristica dei personali voti è che per le prime due persone esistono al plurale 
ACC distinti 45 , med'd'eD e ted'd'eD. 



40 Fonti: Lanest 1982, 189-194 (BF); Bergsland 1976, 52-53 (Lp.N montano occidentale st. in ort. Bergsland - 
Ruong); Kuruc 1985, 547 (Lp.E Kd st.); Potapkin - Imjarekov 1949, 339 (Mo. st.); Kovedjaeva 1966a, 246 (Mr.M 
st.); Lytkin 1961, 877 (Ko. st.); Tepljasina 1966, 269 (Ud. st.); Rombadeeva 1966, 350 (Mn.N st.); Terescenko 
1966, 427 (Ng. st.); Prokof'eva 1966, 404-405 (Sk.N st.). 

41 L'ipotesi, sia pure con diverso vocalismo (/le nei radicali ed a nel suffisso), credo risalga ad Erdélyi 1974, 398-399 
ed è stata recentemente riproposta da Raun 1988, 562. Su -nA in generale cfr. Ojansuu 1922, 26; Lehtisalo 1936, 
119esgg.;ALVREl985, 158. 

42 Per una dettagliata discussione del problema, nonché per la proposta che tale struttura sia da proiettare in FU in base 
ad una discussa concordanza con l'ungherese, cfr. Manzelli 1988, 6 e Barbera 1995, n. al § 4.2.2.1. 

43 Fonti: Hakulinen 1957, 1.60 (Su.); SKES, 338b (Ka.N\S, Au.); LyS, 251b (Ly.N\C\W\S); SVeJa, 347 (Ve.N di 
Pervakat, Ve.CW di Jàrvenkula e Pecoi/1, Ve.CE di Ponda/1 e Simgàf, Ve.S di Sodjàrv\Caig/l); Laanest 1982, 192 
(In.E e lEe.Vò); InS, 329b-330a (In.C, S e W del Rosona); VoEG s.v. (Vo.W di Kattila ed E; il Vo.W di Jògòperà 
coincide con il Vo.E); LAVOTHA 1973, 46-47 (Ee. st., Kurzform; la Langform, di origine probabilmente genitivale, è 
meie); LiW, 219a (Li.E, W e Sa.). 

44 II maggiore riferimento sull'argomento è A68, 54-55. 

45 Cfr. A68, 19 e 55; cfr. Barbera 1995 §§ 4.1.1.3, 2.3.2.3.7, 2.3.2.3.5 e 2.3.2.3.8, § 4.4.3.2.1. Il fenomeno, pur 
innegabilmente importante in quanto si tratta dell'unica circostanza in voto in cui l'ACC non coincide formalmente con 
alcun altro caso, risulta tuttavia di diffusione dialettale assai ristretta, essendo limitato a Kattila e dintorni, Mati, 
Kòrvòttula e Lempola. Inoltre, si avrebbe forse un indizio indiretto della presenza di un ACC in -t anche al SG (ed 
esteso pure alla terza persona), se fosse corretto interpretare l'affermazione di Ariste che talvolta nei PERS «the 
partitive can also function as the accusative» (A68, 55) come spia di una evoluzione analogica in questo senso. Gli 
esempi di questo fenomeno non sono comunque numerosi: cfr. i seguenti due entrambi da Mati, 

[14a] veta mihnua naizessi < Mati. A68, 55 

'take (SG) [IMP.2] me [PERS1-ACC=PAR] for a wife [TRSL]' 
[14b] piàb^vettà tata < Mati. A68, 55 

'he\she has [PR-3] to take [INF1] her\him [PERS3-ACC=PAR]' 
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4. Anafora e deissi dalla teoria al voto. Preparato il terreno storico, possiamo cercare 

di passare ad un'analisi semantica e testuale delle forme vote, alla luce della teoria contiana, e 
cercando di capirne la logica e riconnetterla alla loro origine. 

4.1 La proposta contiana alla prova dei fatti. Gli articoli raccolti in Condizioni di 

coerenza vertono tutti sul tema della deissi, affrontata certo come fenomeno principalmente, ma non 
eminentemente, testuale, tuttavia non senza una costante attenzione alle strutture linguistiche di cui 
il testo è una particolare costruzione. 

Un punto nodale della riflessione contiana è la differenza fra riferimento al mondo, ossia deissi 
esterna o, se vogliamo, deissi indicale - sebbene la Conte non usi questa definizione -, e anaforicità 
intesa come sistema di riferimento interno ad un'area semanticamente e, spesso, testualmente 
definita, entro cui si iscrive anche quel particolare tipo di deissi che Conte definisce come interna, 
metatestuale, e che noi potremmo, forse un poco azzardatamene, chiamare deissi non indicale, ove 
per indicalità si intenda, come noi intendiamo, l'indicazione esclusiva a condizioni, stati od 
elementi del mondo reale e non l'atto medesimo dell'indicare. Questa differenza fra una deissi 
indicale e una deissi non indicale, fra una deissi esterna ed una deissi interna, tornando alla 
terminologia schiettamente contiana, assume una particolare importanza nella definizione della 
natura del fenomeno deittico medesimo, come si può arguire da saggi particolarmente impegnati su 
questo punto come Deissi testuale e Deixis am Phantasma: la semplice istituzione di una deissi 
interna intesa come atto di indicazione, differente quindi dalla mera ripresa anaforica e non 
riducibile ad essa, non indicalmente orientato al mondo reale e circoscritto ad un'area delimitata 
anaforicamente, mette infatti in crisi la ricostruzione in termini bùhleriani e fillmoriani della deissi 
come mero riferimento ad una origo. 

Possiamo agevolmente determinare l'esistenza di una linea Bùhler - Fillmore (cfr. BÙhler 
1965/34, Fillmore 1997/71/5) nella tradizione di studi sulla deissi, secondo la quale la deissi 
individua un centro di ancoraggio, V origo, a partire dal quale viene operata una dislocazione nel 
tempo, nello spazio e per quanto riguarda l'indicazione personale. Il sistema on'go/dislocazione 
individua il funzionamento della deissi esterna in maniera sostanzialmente corretta, ma tralascia 
completamente la questione riguardante la natura dell'atto di indicazione, e, così facendo, inibisce 
la possibilità di pensare correttamente ad altri tipi di deissi. 

Se ci muovessimo esclusivamente all'interno di questa linea Bùhler - Fillmore, dovremmo 
inevitabilmente riconoscere che l'unica opposizione possibile è fra deissi, con referenza indicale 
alla realtà effettiva del mondo esterno, ed anafora, che invece implica l'esistenza di uno spazio 
genericamente testuale, al cui interno alcuni elementi rilevanti per questo stesso "spazio interno" 
sono più volte presentati tramite ripresa. Che gli stessi pronomi in molte lingue abbiano tanto 
funzione deittica quanto significato anaforico, infatti, è circostanza ritenuta sostanzialmente 
normale e spesso sottovalutata. L'idea più diffusa a riguardo è che i pronomi abbiano un originario 
uso deittico successivamente specializzato all'espressione dell 'anaforicità in contesti testuali o, più 
genericamente, argomentali. 

I dati del voto, unitamente alla ricostruzione storica del sistema pronominale ugro-finnico, 
dimostrano che in realtà così non è: ma prima di parlarne affrontando una più specifica analisi 
testuale, conviene tornare alla proposta contiana di una deissi interna che, in linea con una 
tradizione anticamente iniziata con la riflessione stoica sulla natura del conoscere e culminata nel 
pensiero semiologico di Peirce, riconduce la riflessione alla natura dell'atto dell'indicare (a riguardo 
cfr. anche Quine 1961). 

In breve, postulare una deissi interna significa ammettere che l'atto dell'indicazione non dipende 
tout court da una origo coincidente con la triade qui/ora/io (cfr. Fillmore 1997/71/5, pp. 27-75), e 

Qualcosa di analogo si è avuto in Ee., dove l'ACC in -d, limitato alle sole prime due persone (originariamente perso- 
nali), e noto come in Vo. marginalmente anche al SG, è venuto a coincidere con il PAR anche al PL. La situazione più 
esplicita si ha comunque in Su. dove tutti i PERS SG e PL ed anche il Q [+ANIM] mostrano un ACC distinto in -t. Il 
fenomeno, pur analogico, è nondimeno abbastanza antico: cfr. OJANSUU 1922, 116; HAKULINEN 1956, 1.62-63. 
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contemporaneamente asserire che deissi ed anafora sono due fenomeni diversi, essendo la seconda, 
per parafrasare una nota definizione della metafora, una sorta di ripresa abbreviata, e la prima 
un'indicazione che, nel caso della deissi interna, obbedisce ad un sistema di disambiguazione 
indicale inerente al sistema testuale o, come nel caso del voto, linguistico . 

La prima reazione di chi difendesse l'approccio Bùhler - Fillmore potrebbe infatti essere quello 
di accettare la deissi interna come esistente ma solo relativamente a testi o, al più, a strutture 
argomentali sufficientemente complesse. Se così fosse, allora la deissi interna sarebbe un fenomeno 
schiettamente pragma-retorico, descrivibile come uno spostamento dell' origo dal mondo reale alla 
struttura testuale/argomentale, analogamente a quanto avviene nel dominio temporale ed in strutture 
di tipo narrativo per il cosiddetto presente storico. 

Se però fosse dimostrabile che, a prescindere dalle strutture testuali, un sistema pronominale è a 
deissi interna, allora dovremmo rivedere profondamente, almeno per la lingua in questione, il 
sistema delVorigo bùhleriano - fillmoriano, che dovrebbe anzitutto essere affiancato da un'analisi 
del contesto enunciativo e delle indicazione di disambiguazione deittica espresse (come si può 
ricavare anche da Bar-Hillel 1954/73 e Kaplan 1966/70/3). 

Questa è forse la situazione originaria dell'ugrofinnico, ed è comunque ancor oggi rilevabile, 
seppur criticamente, nella lingua vota. 

4.2 Semantica e storia delle forme vote II sistema del voto si presenta come sostan- 

zialmente unario (cfr. Barbera 1995 cit. e supra), anche per un probabile influsso di superstrato 
dello svedese, ma tuttavia non interpretabile come un semplice sistema deittico unario in cui la 
distinzione vicino/lontano, indeterminata dal sistema linguistico, viene contestualmente determinata 
- come, per l'appunto, in svedese. 

I dati, così come apparivano già dagli esempi iniziali da cui siamo partiti (§ 1.1) e come ancor 
meglio appariranno dall'analisi degli esempi che fra poco (§ 4.4) condurremo, mostrano infatti che 
tanto l'uso di se come quello di kase oscillano in un'opposizione interno/esterno, senza ricorrere 
alla quale risulterebbe pressoché impossibile descrivere il sistema pronominale del voto. 

La differenza contiana deissi interna/deissi esterna si rivela dunque essenziale per l'analisi del 
voto, essa quindi non è una semplice differenza pragma-linguistica connessa con la natura testuale 
di alcuni fenomeni specifici, ma tocca la natura reale dei fenomeni deittici nelle lingue naturali. 

Gli esempi da cui avevamo mosso mostrano infatti un'immediata oscillazione, nella traduzione 
del pronome dimostrativo, fra this e that. L'oscillazione è appunto dovuta a quella confusione fra 
referenzialità anaforica e referenzialità deittica di cui si diceva. Sono convinto che il voto 
rappresenti una fase estrema dello sviluppo BF, in cui fattori esogeni alla storia linguistica hanno 
bloccato la completa rianalisi del sistema pronominale, ancora in atto quando la lingua iniziò a 
morire: questo spiegherebbe la presenza di due pronomi privi di apparente differenza funzionale. In 
genere nelle lingue BF il sistema pronominale tende ad avere uno spiccato valore anaforico (la 
presenza di un *se- anaforico nel sistema è originaria!): è questo un dato che non dobbiamo 
dimenticare se vogliamo comprendere rettamente il processo che ha portato agli esiti voti, che 
sembrano essere immagine di un processo, raggelatosi sul principio, di passaggio verso un sistema a 
doppia referenza con un pronome dedicato all'anafora ed uno dedicato alla deissi 7 . 

II fatto che tanto se quanto kase presentino il medesimo tipo di oscillazione fra anaforicità e 
deitticità rimanendo sostanzialmente indifferenti alla distinzione propriamente deittica fra cose e 



46 È nota l'insistenza contiana sulla natura metatestuale e non metalinguistica della deissi testuale (CONTE 1978/88/99, § 
1.1.1.3 p. 16), ossia sulla sua pertinenza alla parole e non alla langue di Saussure. Ma fenomeni tipicamente ài parole 
capita talvolta che ricevano una codifica nella langue (si direbbe che sono "grammaticalizzati", se non fosse che il 
termine da 'codificati nella grammatica di una langue' è oggidì passato ad (ab)usi per me non condivisibili): e proprio 
per questo tali (rare) occorrenze sono così importanti. 

47 La formazione di un pronome kase accanto all'originario se indica infatti l'inizio di una rianalisi del sistema dei 
dimostrativi in voto; tuttavia la mancanza pressoché assoluta di una differenza nell'uso dei due pronomi suggerisce che 
tale processo di rianalisi si sia interrotto ai suoi inizi, forse per una tendenza della lingua stessa ad estinguersi in epoca 
già sufficientemente alta. 
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fatti vicini e lontano dall' "origo", indica che in voto non vi fu un aurorale passaggio da un sistema 
pronominale anaforico ad uno deittico, ma che iniziò una non mai sviluppatasi suddivisione di ruoli 
che mirava a costituire un sistema dedicato alla referenza anaforica ed uno propriamente deittico, 
ossia a ricostruire un sistema simile a quello che supponiamo fosse quello BF/FU originario. 

Data la particolare situazione geografica del voto, composita isola ugrofinnica in posizione 
sudoccidentale avanzata, ai confini di un'area ove nel corso dei secoli si sono avvicinate e 
sovrapposte influenze, quando non dominazioni, germaniche (teutoniche e svedesi), baltiche e russe, 
e considerato il mai alto numero di parlanti e la loro antica identificazione, almeno culturale e 
religiosa, coi russi, la situazione cui si accennava sopra non è affatto improbabile. 

La creazione di un sistema a due gradi di prossimità può essere spiegata con un fenomeno di 
adstrato (basso)tedesco, l'unarietà nella referenza deittica sembra essere dovuta ad un superstrato 
svedese . Eventuali fenomeni di adstrato sia germanico (ad ovest) sia slavo (ad est) potrebbero 
giustificare l'interpretazione del doppio sistema se/kase come aurorale premessa di una congetturale 
suddivisione di ruoli referenziali fra i due pronomi. 

Che il processo si blocchi è, ancora una volta, probabilmente dovuto alla particolare situazione 
culturale e geo-politica del voto di cui abbiamo riferito più diffusamente nel § 2.4. 

A questo riguardo una breve considerazione sull'unarietà sostanziale del sistema è d'uopo. Come 
spesso avviene nell'evoluzione linguistica, un fenomeno di strato concorre con una situazione 
interna al sistema grammaticale della lingua per determinarne o bloccarne l'evoluzione. Nel caso 
dell'unarietà in voto possiamo assumere, come abbiamo fatto, che l'indeterminazione deittica sia un 
fenomeno di superstrato svedese, tuttavia tale fenomeno agisce su di una situazione linguistica in 
cui già i sistemi unari hanno successo. Nell'area generalmente balto finnica meridionale che 
comprende voto, livone ed estone, infatti, il sistema BF binario (mantenuto in BF settentrionale) si 
infrange e ne emergono varie (più chiaramente unarie in Ee.N, binarie in Ee.S e livone) risistema- 
zioni, riassestamento al quale il voto non perviene, ma conserva comunque l'originario valore 
anaforico: la costruzione di un doppio pronome (tuttora in corso in estone standard) rappresenta, 
infatti, una fase successiva dello sviluppo del sistema baltofinnico, ma tale fase è stata bloccata in 
voto dalla concorrenza di un fattore endogeno, la varietà dialettale della lingua, e di un fattore 
esogeno, l'azione di superstrato dello svedese. 

4.3 problemi Di fonti. Per cercare di meglio illustrare la questione è necessario il ricorso a 

testi più ampi degli ess. [1-7] da cui siamo partiti, ma nonostante la relativa abbondanza di fonti 
pubblicate , vi sono parecchi problemi con cui fare i conti. 

Il primo è la provenienza dialettale. Al di là di una certa unitarietà di quello che abbiamo 
chiamato "voto nucleare" (cfr. supra § 2.3), non solo quando parliamo di "voto" parliamo in genere 
di "voto occidentale", considerando di fatto il cosiddetto "voto orientale" ed ancor più il "voto 
sudoccidentale (o di Kukkuzi)" come varietà autonome (ma con esse cercheremo di istituire 
confronti in prospettiva diacronica), ma all'interno del "voto occidentale" medesimo esiste(va) una 
notevole variazione dialettale (soprattutto a livello fonetico e morfologico): Ariste 1968, Adler 
1986, Barbera 1995 ed il VoEG hanno preso come base il dialetto di Kattila (Katti/la | Kotjim) e 
dintorni. Nelle raccolte edite di testi voti, tuttavia, i testi di Kattila non sono poi moltissimi (si 
trovano prevalentemente nei soli Kettunen 1943 e Màgiste 1959), e questo spiega il relativo 
impasse in cui in una prospettiva storico-descrittiva stretta mi ero trovato in Barbera 1995. In una 
prospettiva più testuale come la presente, è indispensabile il ricorso, sia pure cauto, anche ad altre 
fonti dialettali, sempre all'interno del solo voto occidentale. 

Il secondo è la natura delle traduzioni che quei testi accompagnano, la cui importanza è 
ovviamente fondamentale. La maggior parte sono in estone (Ariste 1941, 1958, 1960, 1962, 1966, 



48 Al di là delle vicende storiche, è nota ancora la presenza di un dialetto svedese nelle zone settentrionali insulari e 
costiere dell'Estonia, il cosiddetto eestirootsi, che fu peraltro oggetto di ripetute indagini da parte di Ariste negli anni 
Trenta (cfr. JUHKAM 1996). 

49 Per una lista più completa cfr. BARBERA 2000, 183-4. 



1969, 1974, 1974a, 1977, 1982; Lensu 1930; Adler 1968; ecc.), cosa che crea naturalmente molti 
problemi data la parziale coincidenza del sistema voto con quello estone: V explicandum, in altre 
parole, rischia di restare oscurato; il ciò non toglie che un uso accorto e consapevole possa talvolta 
esserne fatto. Ariste 1968, tra l'altro, è la rielaborazione inglese curata dall'autore (con Sebeok alle 
spalle) di un originale estone. Una minore quantità sono in finnico (Kettunen - POSTI 1932), che 
presenta problemi minori, data la maggiore distanza dei due sistemi; pochi testi, inoltre, sono in 
ungherese (SzabÓ 1961), né mancano materiali in russo (come quelli desumibili dalle due gramma- 
tichette di Adler 1966 e Laanest 1993). Di fatto, i testi più utili in assoluto sono le due raccolte 
esistenti con versione tedesca (Ariste 1933/35 e Màgiste 1959), tra cui la aristiana è senz'altro la 
più accurata nella traduzione. 

Molto utili sarebbero anche le poche testimonianze di voto antico: ancor più che quelle dei 
krievini di Curlandia (Wiedemann 1870/71), che probabilmente non riflettono un dialetto 
occidentale (ma che pure cercheremo di valorizzare, cfr. § 4.4.), sarebbero fondamentali quelle 
tardo settecentesche cui accennano le fonti russe raccolte in Òpik 1970 e quelle ottocentesche 
presenti nella grammatica di Ahlqvist (più poche altre testimonianze, prevalentemente lessicali o 
folkloriche: cfr. BARBERa 2000, 183) o nella raccolta di canti popolari di Salminen 1928: peccato 
che le prime siano ridottissime (perlopiù liste lessicali o notizie di interesse storico-etnografico) e le 
seconde affatto prive di traduzione (cosicché non ho nessun termine oggettivo esterno con cui 
confrontare la mia intuizione linguistica). Poco aiuto, infine, viene dalle pur interessanti trattazioni 
solo etnografiche come Rànke 1960. 

4.4 Esempi voti. Fatte queste avvertenze, possiamo cercare di passare ad esaminare una 

serie di esempi che ho trascelto dalle fonti di cui al § prec. 

Di norma, glosso col sistema del VoEG solo gli esempi brevi; i testi di una certa estensione sono 
invece solo interlineati con la traduzione presente nella fonte 5 ; dò anche una traduzione italiana 
solo quando la fonte presenta traduzione estone 5 . 

4.4.1 Se deittico testuale. Comincerei da qualche esempio con versione estone, un poco 
perché, come dicevo {supra § 4.3), ciò rappresenta la situazione più frequente, ma anche perché 
consente di fare dei confronti con la curiosa situazione dell'estone standard (cfr. supra § 2.3 al 
fondo), in bilico tra il sistema unario {see "à tout faire") settentrionale ed il binario meridionale. 

In particolare, partiamo con un esempio breve ma completo, [15], che è un proverbio, e quindi 
risulta chiuso ed autoreferenziale, come solitamente sono le forme proverbiali. 

[15] esimein pàivà aprelja se on petòspàivà. 

firstNOM day.NOM april-PAR DEM is.PR.3 deception-day.NOM . 
petellàs i nagràs: petellàs, àlkà uskogàì 

deception-TRSL and.CONJ laugh-TRSL : deception-TRSL NEG-PL. 1 belief-IMP 
'aprilli esimene pàev, see on petupàev. Petetakse ja naerdakse: "petetakse, àrge uskuge!" ' 
'primo d'aprile: è il giorno degli inganni. Tra inganno e riso: "neh" inganno, non ci caschiamo!" ' 

I 16 (35) < Lempola, Solo Kuzmina, 68 a., 1942 = Ariste 1969, 49. 

Qui ci confrontiamo subito con un fatto notevole: sebbene tanto il voto come l'estone siano 
lingue pro-drop, si nota in entrambe nel primo enunciato un uso del pronome se/see "tipo-zY": 
nell'esempio è già presente un soggetto esterno, che precede immediatamente il pronome 
dimostrativo (parafrasi letterale: "primo di aprile questo è giorno degli inganni..."). Tre sono i fatti 



50 Scopo precipuo essendo proprio la valutazione del testo nel suo insieme, la presenza costante delle glosse, 
inevitabilmente invadente, lungi dall'essere di aiuto ne avrebbe in realtà pregiudicato la fruibilità. Resta che glossiamo 
laddove la traduzione non sia sufficientemente letterale da consentire un agevole accesso all'originale. 

51 Che, per noi, è più un altro explicandum in sé che una mera "traduzione"; ed allora, naturalmente, la traduzione 
italiana segue letteralmente il testo voto, non quello estone. 

52 Come 1' "Aprii Fool's Day" sia giunto nell'lngria vota non mi è noto, né se si tratti di fenomeno antico o recenziore. 

53 La traduzione estone di Ariste compare subito dopo la glossa "VoEG-style" . 
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rilevanti per la nostra analisi (teniamoci inizialmente al solo voto): primo, la natura formulare 
dell'enunciato, che, come tutte le forme proverbiali, ha una sua fissità referenziale; secondo, la 
natura pro-drop del voto, che non necessiterebbe di un pronome-soggetto espressamente performato, 
tanto più in contesti in cui il soggetto è già espresso, se non vi fossero ragioni tali da suggerire il 
bisogno di quel pronome; terzo, la posizione del pronome, che, seguendo immediatamente il 
soggetto in un testo, per altro assai breve, esclude un'interpretazione propriamente anaforica. Che il 
rapporto fra gruppo soggetto e pronome dimostrativo sia da interpretarsi come rapporto tema-focus 
è cosa che va da sé, tuttavia su questo rapporto vanno dette alcune cose. 

La posizione del pronome, unitamente alla struttura referenziale eminentemente interna 
dell'enunciato 5 , ci dice che qui ci muoviamo in un contesto di natura segnatamente anaforica, dove 
per anaforico si intende un contesto il cui insieme referenziale è interamente contenuto nell'uni- 
verso di discorso senza un riferimento al modo esterno. Dunque il se di cui parliamo è all'interno di 
un contesto indubitabilmente anaforico, nel senso sopra detto, ma, come notavamo in precedenza, 
non può avere, a causa della sua posizione, un valore di ripresa anaforica, quindi la spiegazione che 
avanziamo per giustificare quest'uso, per noi parlanti italiani idiosincratico, del pronome 
dimostrativo è che esso sia un deittico interno. Il senso dell'enunciato potrebbe così essere 
interpretato come: 'primo di aprile, è proprio questo giorno qui introdotto il giorno degli inganni'. 

Se indica così un referente interno al mondo referenziale del discorso ed espressamente 
enunciato con un vero e proprio atto deittico che ha il doppio scopo di indicare la data come tema 
forte dell'enunciazione mettendone il valore di "giorno degli inganni". Siamo quindi dinanzi ad un 
uso non anaforico ma schiettamente interno del pronome che rivela in maniera a nostro giudizio 
difficilmente discutibile il suo valore di deittico interno. Da tale valore segue la possibilità per il 
sistema pronominale del voto di esprimere la deissi interna, a riprova di un'opposizione non fra 
deissi lontana e vicina ma fra deissi interna ed esterna. 

Il pronome dimostrativo del voto sembra dunque essere usato dai parlanti per marcare l'ambito 
referenziale interno/esterno dell'enunciazione, come è evidente anche nell'esempio [16] seguente, 
in cui riporto il solo inizio della narrazione sulla festa (san Floro e Lauro) dei cavalli 55 : 

[1 6] jcJlàri se opezT eli pràznik. 

St.Florus.and.Laurus.day.NOM DEM horse-PL.GEN was.IPF.3 holiday.NOM. 
nitettT vihko kagroi nurme/ìta. ... 

one mows-PS-IPF.3 sheaf.NOM of oat-PL.GEN fromthe field-ABL... 
Rollapàev, see oli hobuste kirmes. Lòigati nurmelt vihk kaeru. ... 
'Il "jc/làripàivà [18.VIII]": dei cavalli era la festa. Si mietono dal campo i covoni di avena. ...' 

I 135 (13)<Mati, Timofei Morozov, 67 a., 1942 = Ariste 1969, 118-9. 

Ancora una volta la parafrasi dell'enunciato può essere utile per comprendere il valore di 
indicatore del campo referenziale interno/esterno del pronome dimostrativo in voto: "il 
"jc/làripàivà" , questo <giorno qui indicato come "jcJlàripàivà"> dei cavalli era la festa". L'uso è 



54 Poiché il proverbio, in forza della sua rigida formularità, enuncia una verità universale sul mondo, verità che spesso 
ha valore di regola costitutiva del mondo medesimo. 

55 II voto jc/làripàivà (o semplicemente (j)Jìàrì) corrisponde alla festività russa di 0jiopa u Jlaepa {sancii Florus et 
Laurus), celebrata appunto il 18 agosto («fro/la i /lavri [...]. vaissi se on /lari 'Flooruse- ja laurusepàev [...]. Vadja keeli 
see on/làrf» Kat'a Jovleva di Kòrvòttula nel 1964 in ARISTE 1969, 120): cfr. ARISTE 1969, 117-121, RÀNk 1960, 109- 
111, VaKS 1.257. I due fratelli Floro e Lauro, martiri illiri del IV see, sono particolarmente popolari e venerati (e 
comune soggetto di celebrate icone) nella confessione ortodossa: la coincidenza della loro festività con la festa dei 
cavalli e della mietitura dell'avena è "normale" risultato del sincretismo pagano-cristiano, in quest'area particolarmente 
vivo (fino a che, ovviamente, l'ateismo bolscevico non distrusse anche questo): «the Votes, although being ardent 
Orthodox, have, neverthelessf,] not gotten completely rid of their ancient heathenism» (Oinas 1955, 38). Foneticamente 
come da naepa si sia addivenuto ajc/làri può essere spiegato abbastanza plausibilmente: con semplificazione del nesso - 
vr-, falsa restituzione dell'aspirata iniziale (fenomeno comunissimo in voto; esistono comunque anche forme alternative 
senza, tipo /lari, come nell'esempio citato sopra in questa stessa nota), e passaggio ai temi in -i, come la maggior parte 
dei prestiti russi. 



molto simile a quello del precedente esempio, tuttavia, poiché qui siamo non in un contesto 
paremiologico ma in un àmbito narrativo, per cui la struttura a referenza interna non è data in 
maniera rigidamente segnata, come accade per gli enunciati formulari, il valore di selettore 
referenziale del pronome dimostrativo spicca ancor più. 

La posizione del pronome invalida ancora una volta la sua interpretazione come anaforico, e 
comprova che il pronome è un deittico interno il cui valore è quello di indicare come referente 
costitutivo dell'ambito referenziale interno del discorso un elemento importante, in questo caso il 
"jcJlàripàivà" . 

Se questo è, come crediamo, il vero valore del pronome dimostrativo in voto, allora si spiega 
perché esso non sia facilmente eludibile nei contesti analizzati sopra, nonostante la natura pro-drop 
del voto: il pronome dimostrativo, indicandolo espressamente, identifica un componente rilevante 
della struttura referenziale interna al discorso, definendo così la natura stessa del fenomeno deittico 
come rivolto all'interno e non all'esterno dell'ambito enunciativo. In questa luce il rapporto 
tema/focus è un rapporto fra referente (tema) e specifiche referenzialmente rilevanti del referente 
medesimo (focus). 

Dicevamo come tale se non sia facilmente eludibile, ma nell'esempio [17] seguente (l'inizio di 
un'altra narrazione, affatto parallela alla precedente, sulla festa dei cavalli) il se di fatto manca: 

[17] jc/làri eli opezi pràznikka. 

light.day.NOM was.IPF.3 horse-PL.GEN holiday.NOM. ... 

mie sita en màlestà, kéz eli. 

PERSI DEM-PARNEG-1 remember.PR, when [it] was.IPF.3. 

opeze/lJlé nitetti vihko kagrà(-o) ... 

horse-ALL one mows-PS-IPF.3 sheaf.NOM of oat-GEN (-PL.GEN) from the field-ABL ... 

'Rollapàev oli hobuste kirmes. Ma seda ei màleta, millal oli. Hobusele lòigati nurmelt vihk 
kaera [SG.GEN] (-u [PL-GEN]). ...' 

'Il "jc/làripàivà [18.VIII]" era la festa dei cavalli. Io non lo ricordo quando era. Per il 
cavallo si mietono dal campo i covoni di avena ...' 

IX 22-23 (5) < Mati, Ol'ga Ivanova, 73 a., 1964 = Ariste 1969, 1 19-20. 

L'esempio [17] è certo un doppione del precedente 5 , ma vi notiamo una struttura referenziale 
lievemente e pure significativamente diversa rispetto a [16]: l'assenza del pronome dimostrativo in 
posizione iniziale determina una non evidente identificazione di plori come referente interno del 
discorso, tuttavia la presenza di un se anaforico al partitivo nella seconda frase (ed idem in estone), 
di cui jc/ìàri è l'antecedente, sortisce un'identificazione referenziale indiretta. 

La struttura di quest'esempio ci dice due cose: i pronomi dimostrativi in voto possono avere, 
come nella maggior parte delle lingue naturali, sia interpretazione anaforica, come in questo caso, 
sia interpretazione deittica, tuttavia, mentre in altre lingue l'interpretazione deittica è sempre esterna, 
in voto essa può avere valore interno, come negli esempi sopra analizzati, o (occasionalmente) 
esterna: e la situazione, come si vede dalle traduzioni estoni riportate, non è estranea neppure a 
quello strato dell'estone standard più allineato all'estone settentrionale. La presenza di una doppia 
deissi svela, come dicevamo, la natura di selettore dell'ambito deittico del pronome dimostrativo: 
questa funzione di selezione rende in voto gli usi anaforici del pronome selettore particolarmente 
trasparenti. L'uso anaforico del pronome, infatti, indica sistematicamente un àmbito a referenzialità 
interna, in voto come generalmente nella quasi totalità delle altre lingue naturali, ma tale indi- 
cazione è spesso opaca nelle lingue in cui il pronome ha uso deittico prevalentemente esterno ed è 
privo di funzione di selezione dell'ambito referenziale 57 : in voto, invece, l'indicazione anaforica è 
sistematica, legata alla selezione del sistema interno, che rafforza la lettura anaforica. Come 



56 Nella stessa variante dialettale, oltre tutto, sia pure da diverso informante. 

57 Si pensi, ad esempio, alle difficoltà nella disambiguazione referenziale dei dimostrativi in greco antico, od alla 
complessità di alcuni usi di Me in latino, valgano per tutti certi esempi di Plauto e Petronio. 

-69- 



avevamo visto all'inizio, analizzando l'esempio [1], il problema è piuttosto rappresentato dalla 
deissi, che talora cade in contesti nei quali la funzione di selezione d'ambito può essere in qualche 
maniera bloccata. 

4.4.2 Se "cataforico" e se = tama "anaforico debole". L'uso "cataforico" di se risponde 
così chiaramente alla sua funzione di selettore: la formularità dell'inizio narrativo con se è 
testimoniato anche da molti altri esempi, dei quali ne riporterò solo qualcuno, attingendo ora alle 
raccolte con traduzione tedesca, che, a fronte della perdita del raffronto estone, portano la sicurezza 

co 

di un traducente diverso e stabile; il dialetto più rappresentato è quello di Pummala , il cui 
informante principale è Kigoria Kuzmin 5 . 

Il se iniziale dell'esempio [18] immediatamente stabilisce che il campo referenziale rilevante è 
quello interno al discorso e non il mondo esterno. La definizione di se "cataforico" va dunque presa 
cum grano salis, essendo piuttosto un'estensione analogica che una definizione vera e propria: non 
tanto di ripresa cataforica infatti sembra trattarsi, quanto di indicazione dell'ambito referenziale, 
quasi che il senso dell'enunciato iniziale del nostro esempio fosse "questo, ossia quello che era così 
e così, è l'ambito referenziale rilevante per il nostro discorso: ...". Il senso cataforico è dunque un 
portato, importante ma secondario, dell'uso referenzialmente selettivo del pronome. 

[1 8] se eli ni : mie elin pikkarain pojokkein, . . . 

Das [DEM] war [IPF.3] so [ADVinstrc]; ich [PERSI] war [IPF.l] (ein) kleine [NOM] 
Bursch [DIM.NOM], .... 

< Pummala (LlyMajiHua), Kigoria Kuzmin, 43 a., 1932 = Ariste 1933, 13 n° 1.9. 

Tale uso formulare di se iniziale {idem Ariste 1933, 16 n. 20, ecc.), è regolare anche in casi meno 
formulari come [19]: 

[19] se eli daize minù izàl'vai fàd'afì . tanta meni laHties vetta vettàmàsee' dai ... 

Dies [DEM] war [IPF.3] = ] geschah sogar meinem [PERSI -GEN] Vater [ADES] oder 
[CONJ] Papa [ADES]. Er [PERSI] ging [IPF.3] aus der Quelle [ELAT] Wasser [PAR] [zu 
nehmen [INF2-CL] =] zu holen und [CONJ] ... 

< Pummala (nyMajiHiia), Kigoria Kuzmin, 43 a., 1932 = Ariste 1933, 12 n° 1.8. 

In [19] all'uso cataforico di se iniziale di narrazione, inoltre, si affianca quello di tàmà, il cui uso 
come PERS3 è anche normalmente esteso per il pronome 3 ANAF e non solo per il 3 ovviativo, 
talora con scarsa distinguibilità da alcuni dei se anaforici deboli o "circa-z'f (come potremmo 
chiamarli). 

Il fenomeno è assai frequente, e nel seguente esempio [20] è il medesimo, solo al PL; così anche 
Ariste 1933, 14 n° 18 e molti altri incipit. 

[20] elivàd^deda da babà, nailla eli kajcs vohuà. d'eda meni tsùntàmà, ... 

Es lebten [IPF-PL.3] (ein) Alter [NOM] und [CONJ] (eine) Alte [NOM]. Sie [PL.PERS3- 
ADES] hatten [IPF.3] zwei [NUMc.NOM] Ziegen [SG.PAR]. Der Alte [NOM] ging [IPF.3] 
pflùgen [INF2], ...< Pummala (nyMajiHiia), Kigoria Kuzmin, 43 a., 1932 = Ariste 1933, 6 n° LI. 

4.4.3 Verso ilkase. In generale kase, alla prova dei testi, appare meno frequente di se; quella 
seguente [21] è una delle non moltissime attestazioni. Il testo completo non è molto più lungo di 
quello riportato, e prosegue raccontando perché non bisogna andare ad arare se si incontra lo 
spirito 61 di cui si parla: 



58 Quello di Pummala era un dialetto centrale del voto occidentale molto vicino a quello di Kattila, rispetto al quale si 
distingueva solo per poche minuzie fonetiche, principalmente la dittongazione delle medie lunghe e la maggior 
frequenza delle apocopi. 

59 Sulla cui storia e competenza linguistica cfr. ARISTE 1933, 1 e qui nota 71. 

60 isà und tata sind Synonima [nota di Ariste]. 

61 Sulla persistenza di elementi pagani nelle credenze ortodosse popolari vote abbiamo già commentato. 
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[21] tulÌ2 naizikko\ vassa?, ; tanta meni tsùntàmàsìe . miez^jutté&B : ep^sa mennà tsùntàmàsìe, 
ko kas naizikko tu/leb^vassà vai meneb^uli tie. ... 

(Eine) Fraui [NOM] begegnete [come 2 -IPF.3 against r AD V.ILL] (ihn). Er [PERS3] ging 
[IPF.3] pflùgen [INF2-CL]. Der Mann [NOM] sagt [IPF.3] : man kann nicht [NEG-3 
get.PR] pflùgen [FNF2-CL] gehen [INF1], wenn [CONJ] diese [DEM] Frau [NOM] (einem) 
begegnet [come-PR.3 against-AD V.ILL] oder [CONJ] ùber [PREP] den Weg [GEN] geht 4 
[PR.3]. ... 

< Pummala (IlyMajiima), Kigoria Kuzmin, 43 a., 1932 = Ariste 1933, 27-8 n° 1.23. 

L'esempio precedente (una resa letterale in italiano risulterebbe in qualcosa del genere "Venne 
una donna incontro. Lui andava ad arare. L'uomo disse: non si può andare ad arare quando queste 
donne vengono incontro ...") è interessante non solo per il tàmà, classicamente PERS3 anaforico 
come in [19] e [20], ma anche per la natura invece chiaramente deittica, probabilmente testuale, del 
kase. 

In questo senso è ancora più efficace l'es. [22] seguente (anche in questo caso riporto solo 
l'inizio di alcune brevi Erinnerungen), dove si confrontano direttamente due kase ed un derivato di 
se: 

[22] kwssen tsù-làs^suntùnnU\ i ka'zel pai-kkà. /se on e-fhmà?, ì-szài, pa-ikkv2 / si'n e-lì mi-nù 
à-tà. ... 

Im diesem [DEM.ILL] Dorfe [ELAT] und am diesem [DEM.ADES] Ort [PAR] <bin ich> 
geboreni [PTACP], dies [DEM] ist [PR.3] die Heimat [der (Wohn)ort 2 [NOM]] <meines> 
Vaters [mother-GEN^father-GEN^, hier [ADV E ss] wohnte [IPF.3] meines [eigenen] 
[PERS 1 -GEN] Vàterchen [NOM] .... 

< Kòrvòttula (KopBeTHHo), Anton Stepanov, 72 a., 1943 = MÀGISTE 1959, 25 n° 1.3. 

Qui, nonostante la sintassi della prima frase non sia chiara, la deitticità dei kase e l'anaforicità 
dei se sono sicure, meno sicura è la valenza interno/esterno, testuale o situazionale, dei kase. 

Se tutti gli esempi reperiti presentassero la differenza kase deittico vs. se anaforico riscontrata 
nell'esempio [22] supra, allora potremmo con facilità affermare che, prima che la lingua sclero tiz- 
zasse e, sostanzialmente, morisse, in voto si stava affermando una distinzione sistematica tra due 
pronomi, uno, se, con valore anaforico, l'altro, kase, con valore deittico. 

Che così non fosse lo dimostra però la seguente batteria di esempi (tutti già presentati all'inizio 
di questa lunga disamina, ma che qui riproduco nuovamente per comodo del lettore), in cui sia se 
sia kase hanno chiaro valore di deissi esterna: 

[23a=2a] se eli minu < Kattila = A68, 19 

'that [DEM] was [IPF.3] mine [PERSI -GEN]' 
[23b=3a] se on sigà suku < Kattila = A68, 19 

'this [DEM] is [PR.3] of pig [GEN] stock [NOM] (i.e. unsuitable, good-for-nothing 

people)' 
[23c=6b] kasenna ta/lvenna evàd\^javod2^mahza\ kui ke/lmi, nellT rubli < Kattila = A68, 65 

'this [ESS] winter [ESS] flour 2 [PL] does not cost! [NEG-PL.3 PR] <more> than [CONJ] 

aboutthree [INSTRC], four [INSTRC] r<o>ubles [SG.INSTRC]' 

Se però esistessero solo casi di oscillazione nell'uso deittico, soprattutto in contesti di deissi 
esterna, noi potremmo sempre parlare di un fenomeno interrottosi mentre era ancora in atto. I nostri 
esempi potrebbero infatti essere considerati come prova di una situazione in cui l'uso deittico di 
kase si sta estendendo nonostante il conservarsi, in forma di vestigia, dell'uso non anaforico di se. 

Ma che neanche così non sia lo dimostra per il seguente esempio, peraltro del tutto analogo ad 
[1], in cui siamo strutturalmente impossibilitati a stabilire se kase abbia referenza esterna o interna: 

[24=6a] emmà esa kast sepà < Kattila = A6 8, 21) 

'we are notbuying [NEG-PL.l PR] this article [DEM -PAR] of clothing [GEN]' 
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In altre parole, come in [1] e per le stesse ragioni, il valore di selettore di kase è bloccato ed il 
pronome viene così ridotto a semplice atto indicativo senza indirizzo. Il fatto che tanto kase quanto 
se possano incappare nella stessa ambiguità strutturale è una buona dimostrazione della non 
avvenuta differenziazione funzionale. Nonostante le linee di evoluzione segnate dagli esempi [21- 
22] analizzati sopra, non avviene mai in voto una reale emancipazione dei due sistemi pronominali 
concorrenti. 

Possiamo dire che una tale emancipazione sarebbe stata difficile, non solo per le ragioni storiche 
addotte nel § 2.4, ma anche per ragioni strutturali interne. La creazione di due sistemi specifi- 
camente dedicati all'espressione dell'anafora e della deissi avrebbe comportato una crisi della 
differenza fra deitticità interna ed esterna, comportando anche, alla lunga, la destabilizzazione di 
quell'opposizione fra campo referenziale interno (testuale) e campo referenziale esterno (situaziona- 
le) che sembra legata proprio alla possibilità di distinguere la deissi interna da quella esterna ed 
appare di lunga tradizione in uralico . 

Ancora una volte dunque il campo sensibile è propriamente quello deittico, è in quest'ambito che 
si giocano le possibilità di esprimere l'atto indicale in diverse maniere, ed è in quest'ambito che si 
esercita la funzione selettrice del pronome. In questo senso non solo non è del tutto corretto parlare 
di pronome deittico/anaforico in voto (sarebbe piuttosto meglio dire "pronome selettivo"), ma 
bisognerebbe anche rivedere il vocabolario teorico della "deissi". È infatti necessario, per poter 
analizzare correttamente i dati voti e, più in generale, quelli balto-finnici, avere un quadro di 
riferimento teorico che permetta di identificare l'atto indicale come campo semeiotico pregresso 
alla distinzione deissi/anafora, entrambi fenomeni di natura "indicale" che a questo campo 
pregresso sono ancorate e da questo campo derivano: in questo senso la linea di studi Bùhler - 
Fillmore (cfr. in particolare Fillmore 1997/71/5, 59-75, e Bùhler 1965/34, capitoli. 7 e 9 della II 
parte) viene gravemente meno, limitando la sua descrizione alla deitticità esterna. Bisogna invece 
contianamente mettersi nella condizione di parlare di deitticità interna, ma questo significa 
peirciamente stabilire l'esistenza di un campo indicale come campo segnicamente definito (cfr. 
Bar-Hillel 1954/73). 

4.4.4 La flebile testimonianza dei Krievini. Che le cose in voto siano tanto complesse lo 
dimostra anche il cosiddetto "voto dei krievini" (per cui cfr. supra §§ 2.3 e 2.4). Molti elementi 
purtroppo rendono difficile la valutazione delle sue testimonianze (la mancanza di contesto 6 , la 
provenienza dialettale e le condizioni precarie delle fonti 5 ), che restano purtuttavia vestigia assai 
preziose. 

Il seguente esempio [25], che è l'inizio della traduzione (in un voto invero ormai assai 
approssimativo) della parabola del figliol prodigo (Luca, 15.11) raccolta da Lutzau nel 1815, mostra 
il valore di selettore referenziale del pronome, che ha qui valore di referenziale interno: 

[25] Ùhen rùstul kachd polka. Se norampa ... 

'un uomo [ADES, < Lat. riìste (sic Wiedemann 1871, 80a)] <aveva> due figli. Il più 
giovane ...' 

Vo.Kr Trad. della parabola del figliol prodigo: Lutzau 1815 in Wiedemann 1871, 65. 

Il testo, che è anche un'importante prova del processo di sclerotizzazione linguistica data la sua 



62 Cfr. i materiali storico-comparativi che avevamo allestito nel § 3 e sottoparagrafi. 

63 Per quanto riguarda il contesto, almeno per le frasi isolate raccolte dall' Appelbaum nel 1774, possiamo solo sperare 
che la sua traduzione sia frutto di una buona consuetudine con la lingua e di un'opera rigorosa - cosa di cui è lecito 
dubitare; il Wiedemann, la cui statura è indiscutibile, certo ha fatto quel che poteva per rendere correttamente i dati in 
suo possesso, che però restano tali. 

4 II Vo.Kr non a caso non figura nello schema di Tav. 4: la varietà krievina appare isolata dalle altre varietà "circum- 
votiche", ma è difficile provare per via non congetturale (per impossibilità della fonte di fornire alcuni dei tratti 
richiesti) la sua precisa posizione nello stemma, anche se l'affinità col gruppo dialettale nordorientale dell'estone è più 
che probabile. 

5 La precarietà morfologica di molte delle testimonianze purtroppo fa temere un'imperfetta conoscenza della lingua già 
nei parlanti elicitati. 
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incertezza morfologica, mostra ancora una volta quell'uso di identificazione di un campo di 
riferimento interno al discorso che se spesse volte ha. Anche gli altri esempi di voto krievino vanno 
per solito nella stessa direzione, che sembra relativamente costante. 

Notevole perché pressoché regolare è che se venga tradotto con l'articolo: ciò è affatto regolare 
nella traduzione delle frasi (purtroppo senza contesto) che raccolse Appelbaum nel 1774 riportate 
da Wiedemann 1871 alle pagine 63-65. Di questi esempi che testimoni erebbero il passaggio del 
pronome ad "articoloide", ne trascelgo un paio: 

[26a] Sa mees onn sàkke. 

'der Mann ist blind' Vo.Kr. Appelbaum 1774 in Wiedemann 1871, 64 

[26b] salta linnul peisis walked munnad Vo.Kr. Appelbaum 1774 in Wiedemann 1871, 64 

der [DEMADES] Vogel [ADES] hat [sem-PR.3] imNeste [ELAT] weisse [PL.NOM] Eier 

[PL.NOM] 

Sembra davvero di essere già in presenza del ben noto fenomeno per cui un elemento di valore 
pronominale passa ad assumerne uno nuovo di articolo determinativo: caratteristicamente, infatti, 
oggi troviamo ciò essere avvenuto o stare avvenendo con *se- un po' in tutto il BF, come avevamo 
visto nel § 2.3 al fondo. Naturalmente, due sono gli esempi che immediatamente vengono in mente 
per definire questo tipo di fenomeno: la storia del latino Me 66 e quella del greco antico ó I r\ I zò 67 . 

Soprattutto il greco può essere un buon modello per spiegare i fatti del krievino: il passaggio del 
pronome dimostrativo ad articolo determinativo può infatti essere interpretato, come l'oscillante 
situazione omerica ben dimostra, alla stregua di un passaggio da operatore referenziale a operatore 
di definizione attraverso la sistematizzazione dell'opacità referenziale strutturalmente inerente agli 
elementi deittico/anaforici. Significativamente in greco questo passaggio richiede una fase in cui il 
pronome, forse originariamente deittico, assume un ruolo eminentemente anaforico {questo stesso 
di cui si parla), come tra l'altro dimostrato dalle costruzioni contrappositive (cfr. la voce riassuntiva 
di Chantraine in DÉLG s.v. p. 770, oltre che Chantraine 1958-63, spr. 1.276-9). 

Il valore di articoloide (che non si può ancora parlare di articolo non essendo il pronome 
dimostrativo nettamente trasformato in articolo) è quindi una ennesima riprova dell'esistenza di un 
contesto interno del discorso, un contesto che noi definiamo anaforico, nel quale l'uso del 
dimostrativo per esprimere definitezza è, come si è visto parlando del greco, abbastanza pacifico. 
L'apparente asistematicità del processo non sembra in questo caso essere l'interruzione di un 
fenomeno che aveva la tendenza a diffondersi nella lingua: se accettiamo, e ormai ci sembra d'aver 
dimostrato che vi siano ottime ragioni per farlo, che in voto il pronome dimostrativo funga da 
selettore dello spazio referenziale dell'atto indicativo, se quindi esiste uno spazio sistematicamente 
anaforico nella lingua, allora l'uso del pronome come articoloide in contesti come quelli 
esemplificati è cosa affatto prevedibile. 

Il fatto che poi non si sviluppi un vero sistema di articoli, come accade nel greco, anche se la 
tendenza è presente in tutto il BF, è l'ulteriore riprova dell'esistenza nell'intiera area del voto, senza 
distinzione dialettale, di un doppio sistema referenziale. Analizzando più da vicino l'esempio [26a], 
la cosa diviene particolarmente chiara: in questo caso il pronome se identifica un referente anaforico 
definendolo come l'unico rilevante nel contesto discorsivo, il pronome assume quindi un doppio 
senso di selettore anaforico e determinante di definitezza che ne giustifica il valore di articoloide 
messo in evidenza dalla traduzione di Appelbaum. Il fatto che il pronome sia un selettore di area 
referenziale che può talora definire la determinatezza del referente, d'altronde, spiega sia il fatto che 
assuma valore di articoloide, sia l'assenza di un processo di estensione di questo valore. 



66 Avevamo già adotto (§ 2.3) il caso delVille latino "circa romancum" dell'iscrizione della cripta di Commodilla, 
riportato come es. [8] (e tracce di questo processo sono presenti già nel latino letterario dell'età argentea e tardo- 
imperiale, si pensi all'uso di ille in Apuleio), che assume quel valore di articolo determinativo che troveremo nella gran 
parte delle lingue romanze 

67 Dove l'originario valore pronominale è comunque ancora attestato da alcuni usi omerici, dalle formule 
contrappositive tipo ó juév ... ó Sé, e da altri pochi fenomeni 
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Aggiungerei solo un ultimo esempio di Vo.Kr, per dare conto anche del corrispondente di tàmà, 
normalmente attestato: 

[27] teli onn liihut ennta Vo.Kr. Appelbaum 1774 in Wiedemann 1871, 64 

er [PERS3-ADES] hat [sewi-PR.3] einen kurzen [PAR] Schwanz [PAR] 

La costruzione (adessivo di possesso) è esattamente la stessa di [26b], che però usava se. Ma allo 
stato attuale non possiamo dire se si tratti di un uso specificamente dialettale, oppure se sia un'altra 
traccia di quel processo di specializzazione delle differenti forme pronominali interrotto ai suoi 
aurorali primordi. 

4.4.5 Un primo testo esteso Le analisi fin qui condotte ci permettono ora di affrontare con 
maggiore precisione contesti linguistici più ampi: per questo, anche se brevemente ed in modo 
sintetico, prenderemo in considerazione alcuni testi lunghi. 

Incominceremo con [28], un testo facile (ossia con poche forme di area personale-dimostrativa 
da discutere) ma piuttosto bello: si tratta di un canto nuziale riportato in Ariste 1933 nel dialetto di 
Pummala (cfr. n. 58): 

[28] [pu/lma JlauJlu 'canto nuziale'] 

a 69 %mh Ayzumbuiu BnewAe TlyjiMa auKan : 

ànima Jlugetteli vàvùlie pu/lma aikan : 

Die Schwiegermutter rezitierte dem Schwiegersohn wàhrend der Hochzeit: 
b où Bnew, Bnewnu , 

oi vàvti, vàvuni , 

Oh (du) Schwiegersohn, mein Schwiegersohn, 
e nibi3ud Bbuua, mynu numn ; 

tùzid^vettà, turine pità ; 

hast die auf die Heirat verstanden, verstehe (auch sie ) zu haben ; 
d djiH unuma, KWH-nwin , 

eia epeta kujà palla , 

Lehre (sie) nicht auf der Strasse, 
e djiH padè muio nwin ; 

eia radd'o pe/l/luo' palla ; 

schlage (sie) nicht auf dem Felde; 
f HWJIH3H HHinHHd HHHeend , 

tsùlàzà tsùntàjàd^nà ( tsevàD , 

im Dorfe sehen (das) die Pflùger, 
g necHHÒ aneaead . 

a ' essàjàd^arvavaD . 

erraten (es) die Egger 
h unuma buuac Komon , 

epeta emas koton , 

Lehre (sie) im eigenen Heim, 

i pUXe3 HmH3-HypKbl3bl3 \ 

rihez ^nellàz ^nurkkezez ; 
im viereckingen Zimmer ; 
j Buma bumu buinu xyeoc , 



La versione cirillica è quella scritta di sua mano da Kigoria; quella in ortografia FUF normale è la trascrizione fatta da 
Ariste della recitazione di Kigoria. 

69 Per agevolare i riferimenti, fornisco con delle lettere fuori quadra la numerazione delle righe (che nel caso di [27]b-o 
sono versi); si badi quindi che, ad es., [la] varrà 'esempio 7a' ma [28] a 'riga a dell'esempio 28'. 

70 d. h. die Tochter [nota di Ariste]. 
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veto eJl ( tsi e/l ( tsi-kuvos , 

nimm einem Strohhalm aus dem Strohbund, 
k Humu BupmHHHc ; 

nitti vàrtànàs ; 

Garn von der Spùle ; 
I HjiHU Jiee6 pocxa Bapcu , 

e/l ( tsi lieb^ruoska-varsi , 

der Strohhalm wird (sein) Peitscheinstiel, 
m Humu Jieeó nynumu sima ; 

nitti liep^punottu sima ; 

das Garn die geflochtene Peitschenschnur ; 
n Ka3uxa padè mede uyna , 

71 - 

kazeekà radd'g medd'e euna , 

damit [DEM-GEN ivzYA.POSTP] schlage unseren Apfel, 
o a bota Mecucapn . 

a emà mesi-sarjd . 

[aber =] und deine Honigwabe, 
p Ka3u Ayzumbuiu mujiu scumeuH hmh ko Menu nyjiMuùc Bwin 

kazee' Jlugetteli mi/lJlee esimein àmmà , ko meni pu/lmJlis valla . 

Das rezitierte mir (meine) erste Schwiegermutter, als sie von der Hochzeit wegging. 

17 

q Hwd oh è noKoùnuKa Maxaó Marna neon . 

nud^onjo pokoinikka, makdb^matà tsebi ( à . 

Jetzt ist sie schon (eine) Tote, sie liegt in der leichten Erde. 

< Pummala (IlyMajiHiia), Kigoria Kuzmin, 43 a., 1932 = Ariste 1933, 40-1 n° III. 1 . 

Il testo aggiunge alla nostra rassegna formale anche un suffisso possessivo -ni (riga b), categoria 
che in voto è, infatti, ormai di solito confinata alla poesia o ad espressioni formulari. Ma soprattutto 
presenta, all'interno dello stesso testo e ravvicinati, una coppia di kase (righe n q q) assai notevole, 
perché uno è interno (riga n) ed uno esterno (riga q) al discorso riportato. 

Ovviamente, la natura di questi due kase, con riferimento interno alla narrazione nel primo caso 
ed esterno nel secondo, è evidente e non abbisogna di alcuna discussione se non per segnalarne la 
totale rispondenza alla nostra analisi, sia per quanto riguarda la natura di selettore del pronome 
dimostrativo in voto sia per quanto concerne la mancata distinzione di se e kase. Riportiamo dunque 
il testo come riprova importante delle conclusioni cui siamo fin qui giunti. 

4.4.6 Riflessività ed anaforicità. Un secondo testo esteso, [29], più compatto ma ricco di 
[28], sempre proviente sempre dal medesimo informante, ci permetterà di meglio traguardare i 
riflessivi. 

[29] [lahtéalte 'làhtehaldjas' 73 ] 

a pajatan ize enes, mità mi/ìAeg- tapaHtu nuoren pojon. — 

Ich erzàhle von mir selbst, was mir passierte, als ich junger Bursche war. 



71 Avevamo segnalato come vi fossero oscillazioni nel livellamento (raramente) o meno (prevalentemente) di kase 
all'armonia vocalica: Kigoria sembra di regola applicarla, ma a questo proposito si badi a quanto avverte Ariste circa le 
altre lingue (russo, estone, ingrico) che Kigoria parlava: «Kuzmin' s Estnisch ist in jeder Hinsicht fehlerhaft. Es kommen 
vor: e ausserhalb der ersten Silbe, Vokalharmonie ,k,p,t als Einzellaute prò G, B, D, und andere wotische Ziige» (ARI- 
STE 1933, 1); se quindi Kigoria tendeva ad "armonizzare" anche dove l'estone ha perduto l'armonia vocalica, tantopiù 
poteva regolarizzare forme "eccezionali" nel proprio voto. In formazioni come se-sama, però mostra incertezza, a volte 
applicandola (es. [34]v) ed a volte no (es. [29]1; cfr. n. 75). 

72 E potremmo ripetere, quindici lustri dopo, la stessa sconsolata epigrafe per il voto tutto. 

73 1 voti làhté a/ìtee'D, letteralmente "spiriti delle fonti", sono il corrispondente delle naiadi nel pantheon finnico, sulle 
cui sopravvivenze all'interno del cristianesimo ortodosso voto abbiamo più volte insistito. 
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b menen ucgskert katti/ìaMe" (-JlaJIJle). se eli sùàpàivàl. menem^mis kanavà ranta muò. 

Einmal gehe ich nach Kattila. Es war am Mittag. Ich gehe am [Ufer = ] Rand des Grabens 
entlang. 
e lit ( si ka/ìmoi eli làhe. mis vàtan : meneb ^inèhmin, dai dùmdn: 

Bei dem Friedhof 7 war eine Quelle. Ich schaue: es geht ein Mensch, und ich denke: 
d meneb ^yettà juomd laHties. tu/lem ^mis lit ( sipdlie\ inèhmin hdviz. 

er geht, aus der Quelle Wasser zu trinken. Ich komme nàher, der Mensch verschwandt. 
e vdtan ùHtiep [^jpuo/ìee\ teiseep[^jpuo/ìee\ vdtan : 

Ich gucke auf eine Seite, auf die andere Seite, ich schaue: 
f tanta isub ^IdHtie" serva pai da sugep^patà (pati). 

er sitz auf dem Quellenrand und kàmmt (sich) [den Kopf = ] das Haar. 
g mis seizattusin dai vdtan i tsòhdtin vai aivassasin, dai hdvis^se inèhmin. 

Ich blieb stehen und schaue und hustete oder nieste. Und dieser Mensch verschwand. 
h mis menin, tsàùzin katti/la/l i tuli kotuosee- tagdz. 

Ich ging, besuchte Kattila und kam nach Hause zuriick. 
i pajatan mamaMe, mità mis nàin. marna jutte&B: 

Ich erzàhle der Mutter, was ich [sah = ] gesehen habe. Die Mutter sagt: 
j se eli làHtie" aAte&D vai a/ìtee\ marna jutteeB, 

es [war = ] waren Quellengeister oder (ein) Geist. Die Mutter sagt, 
k etti tsejcsi-pdivdl ndvdt^tagottavad^nàùttd ( ùssà. mis tuoz^e/len nàhnù. 

dass sie sich am Mittage zu zeigen Pflege. Ich habe auch gesehen. 
I mi/lJle tuli vassd dai kerraz^haviz. tuos^senes^samaz ^IdHtiez^nàin. 

Er kam mir entgegen und verschwand plòtzlich. Auch in derselben Quelle sah ich (ihn). 

< Pummala (IlyMajiima), Kigoria Kuzmin, 43 a., 1932 = Ariste 1933, 10-1 n° 1.6. 

Nel testo precedente, tra l'altro, occorrono tre se (righe bgj), uno (riga b) del tipo "circa-zY" (cfr. 
§ 4.4.2) e due deittici, di cui uno (riga j) a cavalcioni di discorso diretto come il kase di [28p]; il 
tdmd (riga/) è normalmente PERS3 anaforico (riga/) come quello di [21]. 

Ma è da rilevare soprattutto l'uso dei rilessivo-equativi raddoppiati ize ené (riga a) e se-sama 
(riga /), che non avevamo ancora incontrato negli esempi, cui si può aggiungere nel testo seguente 
[30] il solo ize. La presenza di forme riflessive, pur derivate ma diverse dal pronome se, indica che 
la riflessività è, come ci aspetteremmo, fenomeno diverso dalla selezione di àmbito referenziale. 
Del resto la riflessività, esprimendo una referenzialità bloccata, è in un certo qual modo estranea al 
problema della selezione di àmbito referenziale, ed è quindi escluso che possa essere espressa dal 
pronome selettore. 

[30] Ùber seine Familie. 

a mì-JìA^om^pe-re sù-rj / ne-lla po-ikà i ke-m tù-tàrtv (-té). / 

Ich habe eine grosse Familie, vier Sòhne und drei Tòchter, 
b a nù-d^jàin ù-jesina- ù-hèe tù-ttdrèekà. 

aber jetzt bin ich allein mit einem Tòchter (ùbrig)geblieben. 
e a ku-za keikk^e-maD / sì't'à e-n td. / 

Wo aber alle (die anderen) sind, das weiss ich nicht. 
d perenna jo ku-oJUlU ne-llv vu-ottv / ' mi-d vze là-sivv (-s) é-n. 

Die Frau [Wirtin] (ist) schon (vor) vier Jahren gestorben, ich selbst bin krank. 

< Villikkala (BejiHKHHo), Ignati Markow, 67 a., 1943 = MÀGISTE 1959, 49 n° IX.28. 



74 kaflmot 'Friedhof - plurale tantum [nota di Ariste]. 

75 Kigoria, s'era detto (cfr. n. 71), tende ad applicare sempre l'armonia vocalica: se con kase ciò non sembra patire ecce- 
zioni, con se-sama ve ne sono, specie nelle forme in doppio bisillabo, come questa in questione, probabilmente perché 
avvertite come formate da due unità prosodiche distinte. 
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4.4.7 TÀMÀ TRA ovviativo vs. anaforico. Nel testo [31] seguente, in cui troviamo due kase 
ed un ADVill sihè derivato da se, quel che più ci interessa è il tàmà di riga e, che ha reale valore 
di PERS3 ovviativo e non, come consueto (cfr. in [19], [20] e [21]) anaforico. 

È una delle poche attestazioni di tàmà che abbia quest'uso, a riprova della difficile situazione 
dell'evoluzione pronominale in voto, bloccata, come abbiamo più volte detto, dalla particolare 
situazione storica e geo-linguistica del voto. 

[31] Erinnerungen an die Schwedenzeit. 

a kwse e: li ma sve-tà ma: / mò- jà-immv si'jcjcè e-làmà. / 

Diese Land hier ist ein Land der [des] Schweden gewesen, wir sind hier[her] wohnen 

geblieben. 
b pjo -trv pe-rvoi / ku -nikvz^zavojeva 77 kwsè ma. / 

Zar [Kònig] Peter der Erste eroberte dieses Land, 
e vo-d^i narv^e:li tà'mma / své-tà ma. 

Sieh mahl, auch Narva gehòrte ihm [war sein], (war) ein Land der Schweden. 
a na-rvaz^e:li kré-posti své-tà. / 

Es gab [war] in Narwa eine schwedische [des Schweden] Befestigung. 
a me -il on své-tà ka-AmoD. 

Wir haben eine schwedische [des Schweden] Begràbnisstàtte [Graber]. 

< Kòrvòttula (KopBeTHHo), Anton Stepanov, 72 a., 1943 = MÀGISTE 1959, 25 n° 1.2. 

La normalità è piuttosto quella rappresentata nel testo [32] seguente, che come il precedente 
esibisce in apertura un ADVill sihè derivato da se (per simili derivati cfr. infra § 4.4.9, es. [34]f e 
[24]ijkt), ma poi sembra muoversi nella direzione di un rilevante uso di tàmà come anaforico puro: 

[32] Die Begràbnisstàtte. 

a nà-etéka -fìmed^ on/a -in sip'è a -vvetes. / 

Sieh mal, es gibt [ist] (hier) eine Begràbnisstàtte [Gràber], man begràbt immer (noch) 

dort[hin]. 
b nved^onjo va-naD. /a ku-i ku-ttsùas tà'tà? / 

Sie ist [sind] schon alt, aber wie heisst man sie? 
e ka -fìmed^ i ka -fìmeD / ei ku -ttsùa ku -iniD. 

Begràbnisstàtte, [und] Begràbnisstàtte, man nennt (sie) nicht anders [auf keine (andere) 

Weise]. 

< Iltovòi (YHflOBa), Avdakija Efremova, 65 a., 1943 = MÀGISTE 1959, 52 n° X.33. 

4.4.8 Personali deittici (1,2). Da ultimo un testo [33] in cui per la prima volta vediamo 
anche i personali di 1 (riga d) e 2 (riga e). 

L'uso contrastivo dei pronomi personali e del pronome selettore (cfr. Quine 1961) dimostra che i 
primi sono preferiti quando si voglia mantenere una referenza rigida indipendente dal contesto e 
dalla selezione dell'area referenziale, a riprova di quanto fin qui detto: la necessità di sottolineare la 
persona, estraniandone l'identificazione dal contesto di locuzione, comprova che la refere nzialità 
del dimostrativo dipende, come nel caso di kase e tàmà, dall'ambito prescelto. 

[33] [esimeized^ampàD 'primi dentini'] 

a Jlahze/l esimeized^ampàd^làHtevàd^vàllà, 

(Wenn) dem Kind die ersten Zàhne weggehen, 
b sis^tsàjcsiss vizgata ahjuo- pàlie" i Jlukeàs : 

so befiehlt man (ihm, sie) auf dem Ofen zu werfen, und es wird [gelesen = ] gesagt: 
e si/lJlée', iri, Jluized^ampàD, 

dir [PERS2-ALL], Maus, knòcherne Zàhne, 
d a mi/l/lée' rautezeD. 
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aber mir eiserne! 
e ammas^ tsclez pùòrùttàz^ ùmpàr pàtà. 

[Der Zahn = ] Mit dem Zahn in der Hand wird (die Hand) um dem Kopf gewirbelt. 

< Pummala (IlyManima), Kigoria Kuzmin, 43 a., 1932 = Ariste 1933, 53 n° IV.24. 

Si noti, peraltro, anche che la differenza da se in molti casi LOC è assai debole, essendo data 
solo dalla diversa serie armonica: PERS2-ALL siJlJlee < sinuJlJlee [-ANT] vs. DEM-ALL 
sillee [+ANT]. 

4.4.9 Un ultimo testo esteso. Da ultimo voglio presentare un testo lungo e particolarmente 
ricco, un racconto sui domovikka 1 fornito dal solito Kigoria Kuzmin, sempre nel dialetto di 
Pummala (cfr. n. 58); in questo testo, infatti, ricorrono vari esempi di se, kase e tàmà, coprendo 
sostanzialmente quasi tutti i fenomeni che abbiamo finora incontrato, consentendoci così un ultimo, 
ricapitolativo, volo d'uccello sulle questioni trattate. 

[34] [domovikka 'majahaldjas'] 

a fata vaje/lti mustaJlaizeèkà opezee. 

Der Vater tauschte (ein) Pferd [mit (einem) Zigeuner = ] gegen das eines Zigeuners. 
b pani tàmà evveesee- tsini, pani einoi etiesie" ; open neisi sùòmàie\ 

Er band es in dem Stallraum an (und) legte (ihm) Heu vor ; der Pferd fingt an zu fressen. 
e udì fata kùleB : open koliseB. meneb^vàttamàsee\- 

Nachts hòrt der Vater : das Pferd macht Larm. Er geht, (um) nachzusehen ; 
d open on seimee" a/1, pruobas ^kaivà valla, iicgsinà ep^sànnu. 

das Pferd ist unter der Krippe. Er versuchte (es) herauszugraben, allein konnte er (es) nicht. 
e meni kutse sussedà apìsee\ susseda jutteeB : 

Er gingt (und) rief den Nachbar zu Hilfe. Der Nachbar sagt: 
f kase open be/le siflfli^jevveà mùò. 

diese Pferd [ist dir nicht nach den Stallràumen] passt nicht in deinem Stallràumen. 
g kaz^domovikko teukki seimee' a/lJle . 

[Dieser = ] Der Hauskobold hat es unter die Krippe geschoben. 
h pruobà panna tela paikkàsee\ 

Versuche, es auf einem anderen Platz zu stellen! 
i vatà, ko neizeb^arjà pletittàmà, sistàmàfjp suvà tata. 

Schaue, wenn er anfangt, die Màhne zu flecken, dann liebt er nicht, 
j cif^jko sirgoB ùvàssi argà, sistàmà suvàB. 

aber wenn er die Màhnen gut glàttet, dann liebt er es. 
k fata tsùzùB: millin tàmà on siz ? sàptàtà nàhà ? — 

Der Vater fragt: Wie ist der denn? Kann mann ihr sehen? 
I susseda jutteeB : et tata nei e. 

Der Nachbar sagt: du siehst ihn nicht. 
m fata meni ùòsies seimee- a/lJle vaHtimàsee' dai nà ( tsi. 

Der Vater ging zur Nacht unter die Krippe, (um dem Kobold) aufzulauern, und er sah (ihn 

doch). 
n da issu opezeAee- sel ( tsà — domovikka. 

Und er setzte sich auf das Pferd — der Hauskobold. 
o tàmà eli niku katti, i sugeb^opeze/l/l^arjà. 

Er war wie (eine) Katze, und kàmmt dem Pferde die Màhne. 
p opeze/l/l^arjas tulizet^sàtiet^karizevaD. fata eittu, josi rihiesie\ 

Es fallen dem Pferde feurige Funken aus der Màhne. Der Vater erschrak 77 , lief in die Stube, 



76 Sugli "spiriti domestici" voti cfr. il ricco ed assai ben documentato Ernits 2006b. 

77 Sic; anche infra, riga t. 
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q v etti fonar! , meni vattàmàsée\ eb^nàhnù mità. neisi makàmàsée\ 

nahm (eine) Laterne, (und) ging, nachzusehen. Er sah nichts. Er legte sich ihn. 
r uomniz^meni vattàmà, vatàb^opezeJW^arjà. 

Morgens ging er, (nach)-zusehen, beschaut [dem Pferd = ] die Màhne des Pferdes. 
s keikk[^]ùvàs sirgottu, i jutteep ^sussedaMe- : mie vaHtizin da nàin. — 

Alles ist gut geglàttet, und er sagt dem Nachbar: ich lauerte auf, und ich sah (ihn). — 
t millin siz^eli ? — a niku katti. — mis eittùzin daijohzin rihiesie\ 

Wie war er denn? — Aber wie (eine) Katze. — Ich eschrak und lief in den Stube, 
u neisi makàmàsee\ nut uzgon, etti on ta/ìoz ^domovikko. 

ich legte mich schlafen. Jetzt glaube ich, das es [ist = ] (einen) Hauskobold in Bauernhofe gibt. 
v domovikko vai domovikka, se on ùcgs se'sama. 

domovikko oder domovikka, das ist ein und derselbe. 

< Pummala (LLyManima), Kigoria Kuzmin, 43 a., 1932 = Ariste 1933, 14-5 n° LIO. 

Nel testo, come vedete, ricorrono molti fenomeni interessanti; qui non possiamo ormai che 
cursoriamente passarne in rassegna i più notevoli: 1. {righe fg) due tipici esempi di kase; 2. (bk) due 
esempi contrastati di verbo di 3 con soggetto pronominale espresso (in frase positiva) e non (in 
interrogativa); 3. {bijko:v) molti ess. di tàmà sogg, da contrastare con uno di se; 4. (ikl) altri ess. di 
tàmà in ruolo oggetto al partitivo; 5. (v) un es. del riflessivo-equativo composto di se; 6. (f,v) 
assoggettamento di kase e sesama all'armonia vocalica ; 7. (ijkt,f) alcuni esempi delle numerose 
forme avverbiali derivate dal tema se-, quattro di siz (<*LOC) ed una di siJIJIà (<ADES), da ag- 
giungere al sihè (<ILL) che avevamo visto negli ess [31]a e [32]a. Tra tanta dovizia, ci permettere- 
mo solo ancora un paio di osservazioni sui punti 7. e 3. 

La prima è sui derivati avverbiali. L'avverbio siz, infatti, derivato da un originario locativo, ha 
marcata funzione di coesione testuale, come si nota chiaramente nelle domande alle righe k {millin 
tàmà on siz? \ Wie ist der denn?) e q {millin siz^eli ? \ Wie war er denn?): questo "allora" ha la 
funzione di "cucire" fra di loro parti del testo, nella fattispecie la spiegazione, che segue alla 
domanda, con le premesse che la pongono. Il carattere nettamente coesivo dell'avverbio conferma 
così la "anaforicità" originaria di se e dice qualcosa sul suo ruolo di selettore referenziale. In lingue 
nelle quali il dimostrativo ha valore prevalentemente deittico sembra difficile che avverbi o 
locuzioni avverbiali derivate dall'ambito del pronome dimostrativo possano fungere da coesivi del 
testo, viceversa in voto è proprio l'avverbio derivato dal pronome dimostrativo ad avere questo 
ruolo: la cosa si spiega se accettiamo non solo che il pronome dimostrativo possa individuare i 
referenti interni al discorso, ma che in realtà il ruolo primario del pronome sia proprio questo. In 
altre parole, lo schema referenziale del dimostrativo voto sarebbe: riferimento interno — > blocco del 
riferimento interno — > uso marcato — > riferimento esterno; proprio la testualità dell'avverbio 
derivato, non a caso una forma relittuale di locativo (un caso che allo stato puro non è conservato 
produttivamente da alcuna lingua BF), è una prova forte a sostegno di questa evoluzione, come già 
detto nei §§4.4.1 e 4.4.2. 

La seconda riguarda l'uso referenziale di se soggetto (riga v, finale) in opposizione agli usi di 
tàmà soggetto (righe bijko), ed è per noi particolarmente importante. Per tàmà soggetto (cfr. es. 
[21]) la traduzione di Ariste oscilla normalmente fra er {bijo) e der (k): l'oscillazione rivela che 
l'uso del pronome è puramente anaforico, del resto ritroviamo tàmà in posizione di soggetto solo 
all'interno della narrazione in cui l'informante descrive l'incontro fra suo padre e lo spirito, il 
domovikko, ed è generalmente assai difficile ritrovare il pronome in posizione non anaforica (cfr. in 
questa rassegna il solo [31] e). 

A quest'uso puramente anaforico fa da riscontro l'uso di se riga v: il nostro se ha come referente 
il "domovikko vai domovikka" di cui si è venuti parlando nel testo, quindi l'uso referenziale di se 
risulterebbe ambiguo se non avessimo presente il concetto di "deissi intema al testo" della Conte. 



78 Cfr. n. 71 per il fenomeno in generale, e n. 75 per le "eccezioni dell'eccezione" con il solo sesama. 
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L'uso di se in unione con sesama, che ha qui valore di articoloide indeterminativo (cfr. la 
discussione degli ess. [26ab] in § 4.4.4. per il concetto di articoloide), sebbene la traduzione di 
Ariste possa fuorviare, indica l'identità materiale (de re) delle due forme grammaticali '' domovikko 
vai domovikka", ma il referente cui fa riferimento se è lo stesso che ha il nome di domovikko o 
domovikka, quindi non è possibile né in tedesco né in italiano una traduzione chiara del passo, che 
può essere parafrasato come: "Chiamare questo (cioè lo spiritello di cui si parla nel racconto) 
domovikko o domovikka è la stessa cosa" (cfr. Quine 1961 e Kaplan 1966/70/3). 

L'impossibilità della traduzione letterale in italiano e tedesco dipende dall'assenza di forme 
pronominali capaci di selezionare uno spazio referenziale interno al sistema di riferimento rilevante 
per la locuzione diverso dallo spazio di riferimento della deissi esterna. Chiaramente questo spazio 
è diverso da quello semplicemente anaforico, che è limitato al solo flusso testuale e discorsivo: la 
deissi interna ha come aggancio referenziale questo spazio interno, a cui il suo atto di indicazione si 
rivolge, ma permette di selezionare la porzione di spazio anaforico che è necessaria, come in questo 
caso, per dare senso ad affermazioni esterne ma in qualche modo tangenti lo spazio anaforico 
medesimo. L'uso di se risulta così coindicale fra spazio anaforico e mondo esterno, esattamente nel 
senso di coindicalità determinato dalla Conte per la deissi interna, a riprova della funzione di 
selettore di questo pronome. 

Tralasciamo un'analisi dettagliata delle altre caratteristiche referenziali di questo testo, che ci 
porterebbe via tempo e spazio eccessivi: del resto, il lettore spero abbia ormai tutti gli elementi utili 
(cfr. in particolare per fama § 4.4.7, per se §§ 4.4.1, 4.4.2 e 4.4.6, e per kase §.4.4.3.) per farla da sé. 

5. Conclusioni. Il presente lavoro, proponendosi di tematizzare in chiave diacronica una 

questione centrale del pensiero contiano, ha avuto anzitutto lo scopo di dimostrare che 
effettivamente in voto il sistema dei pronomi dimostrativi abbia la funzione di selezionare l'area 
referenziale cui l'enunciato si riferisce: abbiamo così cercato di evidenziare, sommando gli 
strumenti usuali della linguistica storico -comparativa con quelli della linguistica testuale, le ragioni 
storico-evolutive che giustificano una lettura di questo genere del sistema voto, e non solo, giacché 
speriamo di aver almeno indicato aree dell'estone che presentano fenomeni strettamente analoghi. 
Nel condurre quest'analisi ci siamo resi conto che era necessario dotarsi di un apparecchiamento 
teorico differente da quello di Bùhler - Fillmore ed abbiamo ritrovato nella distinzione deissi esterna 
vs. deissi interna avanzata da Maria Elisabeth Conte la bussola necessaria per mantenere l'orienta- 
mento nella difficile lettura dei fatti voti e, più in generale, baltofinnici. 

Certo, vi sono ancora questioni teoriche che la ricerca dovrà affinare in futuro, in particolare: (1) 
la definizione teorica del campo indicale interno, che noi, forzando la definizione in maniera spero 
sufficientemente perspicua, abbiamo chiamato "anaforico"; (2) la definizione semantica e funzio- 
nale di ciò che abbiamo definito "atto dell'indicare" o "indicalità"; (3) il finale acclimatamento di 
questi concetti in una ricerca diacronica. Riguardo almeno al terzo punto, riteniamo di avere 
argomentato l'utilità della teorizzazione di una doppia deissi indicando modi e vie di tale 
acclimatamento. 
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von Y[rjò] H[entik] Toivonen, I-II, Helsinki, Suomalais-ugrilainen Seura, 1948 "Lexica 

Societatis Fenno-Ugricae" 10. 



V 



Jori 
1973 
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KESKJa -> Lytkin - Guljaev 1970 

KEWal -> Mayrhofer 1953-80 

Kettunen 

1930 Lauri Kettunen, Vatjan kielen àànnehistoria. Toinen uusittu painos, Helsinki, [Suoma- 

laisen Kirjallisuuden Seura], 19302 [1915 1] "Suomalaisen kirjallisuuden seuran toimi- 

tuksia" 185. 
1938 Lauri Kettunen, Livisches Wòrterbuch mit grammatischer Einleitung, Helsinki, Suoma- 

lais-ugrilainen Seura, 1938 "Lexica Societatis Fenno-Ugricae" 5. 
1986 Lauri Kettunen, Vatjan kielen Mahun murteen sanasto. Toimittanet Jarmo Elomaa, Eino 

Koponen ja Leeena Silfverberg, Helsinki, [Suomalais-ugrilainen Seura], 1986 "Castre- 

nianumin toimitteitta" 27. 

Kettunen - Posti 

1932 Nàytteteità vatjan kielesta. Julkaisseet Lauri Kettunen ja Lauri Posti, Helsinki, 

Suomalais-ugrilainen Seura, 1932 "Suomalais-ugrilaisen Seuran toimituksia \ Mémoires 

de la Société Finno-ougrienne" 68. 

KOLJADENKOV - CYGANOV 

1949 M. H. KojumeHKOB - H. O. HbiraHOB, 9p3hhcko - pyccKuu c/ioeapb, 18.000 cjiob, no,u 

pe^aKirneH ^[mhtphji] B[jia^HMHpoBHHa] Ey6pHxa, MocKBa, Focy^apecTBeHHoe 
H3^aTejibCTBO HHOCTpaHHbix h HaiiHOHajibHbix CjioBapeìi, 1949 "Mopjjobckhh 
HayHHO-HccjiejoBaTejibCKHÌi HHCTHTyT 5i3biKa, jiHTepaTypbi h hctophh npn CoBeTe 
Mhhhctpob Mophobckoìì ACCP". 

KORZEN - LUNDQUIST 

2007 Comparing Anaphors. Between Sentences, Texts and Languages, edited by Iorn Korzen 

and Lita Lundquist, [Kobenhavn], Samsfundlitteratur Press, 2007 "Copenhagen Studies 
in Language" 34. 

Kovedjaeva 

1966 E[BreHH5i] H. KoBe^fleBa, Jlyzoeo-eocmonHuù juapuucicuu H3UK, in JaNSSSR III, pp. 221- 

240. 
1966a EfBremra] H. KoBe^eBa, ropnoMapuucKuu H3UK, in JaNSSSR III, pp. 241-254. 

Krejnovic 

1968 E[pyxHM] A[6paMOBHH] KpeÉHOBHH, ROKaeupcKuu R3UK, in JaNSSSR V, pp. 435-452. 

Kujola 

1944 Lyydilàismurteiden sanakirja. Ainekset kerànneet Kai Donner, Jalo Kalima, Lauri 

Kettunen, Juho Kujola, Heikki Ojansuu, Elvi Pakainen, Y[rjò] H[entik] Toivonen ja 
E[emil] A[ugust] Tunkelo. Toimittanut ja julkaissut Juho Kujola, Helsinki, Suomalais- 
ugrilainen Seura, 1944 "Lexika Societatis Fenno-Ugricae" 9. 

Kuruc 

1985 CaaMCKo - PyccKuu Cjioeapb, 8000 cjiob, no^ pe^aKirneii P[HMMa] ^[HMHTpHeBHa] 

Kypyq | CaMb - Pyiuiu CoaeKnehKb, 8000 càHH3, M. P. Kypyq ByMKbeM MHjijibrs, 

Moskva, "PyccKHÌi johk | Pymni khjiji", 1985. 

Laakso 

1989 Vatjan kàànteissanasto, toimittanud Johanna Laakso, Helsinki, Suomalais-Ugrilainen 

Seura, 1989 "Lexica Societatis Fenno-Ugricae" 22. 

Laanest 

1982 Arvo Laanest, Einfùhrung in die ostseefìnnischen Sprachen. Autorisierte Ùbertragung 

aus dem Estnischen von Hans-Herman Baerens, Hamburg, Helmut Buske Verlag, 1982 
[Originaltitel Sissejuhatus làànemeresoome keeltesse, Tallinn, 1975]. 

1993 A[pbo] JlaaHecT, Boòckuu H3UK, in JaM 1993, pp. 48-55. 



Lakó et ahi 

1967-78 A magyar szókészlet fìnnugor elemei etimológiai szótàr hàrom kòtetben. Fòszerkestò 
Lakó Gyòrgy, Budapest, Akadémiai Kiadó, 1967-1978. | I. A-Gy, szerkesztò Rédei 
Kàroly, ibidem, 1967; II. H-M, szerkesztò Rédei Kàroly, ibidem, 1971; III. N-S, 
szerkesztò Rédei Kàroly és K. Sai Eva, ibidem, 1978. 

Lausberg 

1971 Heinrich Lausberg, Linguistica romanza. I. Fonetica. II. Morfologia, Traduzione dal 

tedesco di Nicolò Pasero, Milano, Feltrinelli editore, 1971 [prima edizione italiana 
ampliata e riveduta dall'autore], 19762. Edizione originale: Romanische Sprachwissen- 
schaft, I. Einleitung und Vokalismus, IL Konsonantismus , III. Formenlehre, Berlin, 
Walter de Gruyter, 1969. 

Lavotha 

1973 Òdòn Lavotha, Kurzgefasste estnische Grammatik, Wiesbaden, Otto Harrassowitz, 1973 

"Veròffentlichungen der Societas Uralo-Altaica" Band 9. 

Lehmann 

1986 Winfred P. Lehmann, A Gothic Etymological Dictionary. Based on the third edition of 

Vergleichendes Wòrterbuch der gotischen Sprache by Sigmund Feist. With bibliography 
prepared under the direction of Helen-Jo J. Hewitt, Leiden, E. J. Brill, 1986. 

Lehtinen 

1963 Meri Lehtinen, Basic Course in Finnish (supervised and edited by Thomas A. Sebeok), 

Bloomington - The Hague, Indiana University - Mouton & Co., 1963 "Indiana 

University Publications. Uralic and Altic Series" voi. 27. 

Lehtisalo 

1936 T[oivo Vilho] Lehtisalo, Ùber die primàren ururalischen Ableitungsuffixe, Helsinki, 

Suomalais-ugrilainen Seura, 1936 "Suomalais-ugrilaisen Seuran toimituksia \ Mémoires 
de la Société Finno-ougrienne" 72. 

1956 T[oivo Vilho] Lehtisalo, Juraksamojedisches Wòrterbuch, Helsinki, Suomalais-ugrilai- 

nen Seura, 1956 "Lexica Societatis Fenno-Ugricae" 13. 

Lensu 

1930 5i. Si. JleHcy, Mamepuanu no zoeopaM eodu, in AA. VV. 1930, pp. 201-305. 

LìW^Kettunen1938 

LyS -> KUJOLA 1944 

Lytkin 

1961 B[acnjiHH] H[jibHH] JImtkhh, KoMua - Pona Cjioeapb, 25.000 kbimmh kbib, cjioBapb 

noMÒ BaÉò^ÒMa komh KbiBjibicb rpaMMaTHHecKÒH onepic, kojòc rnxHCHbi npocj». B. H. 
JImtkhh fla j\. A THMymeB | Komu - PyccKuu Cjioeapb, okojio 25.000 cjiob, c 
npnjioxeHHeM rpaMMaTHHecKoro onepKa komh a3biKa, cocTaBjieHHoro npocj). B. H 
JlbiTKHHbiM h J\. A. THMymeBbiM, MocKBa, HHOCTpaHHÒH ^a NauHOHajibHÒìi 
CjioBapbJicjiÒH rocyAapcTBeHHÒH H3^aTejibCTBO, 1961bo rocyAapcTBeHHoe 

H3flaTejibCTBO HHOCTpaHHbix h HaiiHOHanbHbix CjioBapeÉ, 1961 "CCCP-ca HayKaac 
AKaAeMHJinÒH Komh Onjinan | Komh Onjinan Axa^eMHH HayK CCCP". 

Lytkin - Guljaev 

1970 B[acHjiHÌi] H[jibHH] JIhtkhh, - E[BreHHH] C[eMeHOBHH] ryjuieB, KpamKuù smuMonozu- 

necKuu cjioeapb komu H3UKa, MocKBa, H3£aTejibCTBO "HayKa", 1970. 

M59 -> MÀGISTE 1959. 

MÀGISTE 

1959 Woten Erzàhlen. Wotische Sprachproben. Gesammelt und herausgegeben von Julius 

Màgiste, Helsinki, Suomalais-ugrilainen Seura, 1959 "Suomalais-ugrilaisen Seuran 
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toimituksia \ Mémoires de la Société Finno-ougrienne" 118. 
1982-83 Julius Màgiste, Estnisches etymologisches Wòrterbuch, Helsinki, Finnisch-Ugrische 
Gesellschaft, 1982-83. | I. Einfùhrung, A-Hermes, [pp. lxxvj+336], ibidem, 1983. II. 
Hernes-Kamm, [pp. 337-680], ibidem, 1982. III. Kamm-Kuht, [pp. 681-1018], ibidem, 
1982. IV. Kuhtuma-Loom, [pp. 1019-1359], ibidem, 1982. V. Looma-Niit, [pp. 1360- 
1697], ibidem, 1982. VI. Niitma-Piirama, [pp. 1698-2032], ibidem, 1982. VII. Piirask- 
Raba, [pp. 2033-2371], ibidem, 1982. Vili. Raba-Sarm, [pp. 2372-2707], tózWem, 1982. 
IX. Sarn-Tahr, [pp. 2708-3044], zèztìfem, 1982. X. Taht-Tuur, [pp. 3045-3390], ibidem, 
1982. XI. Tuur-Varukil, [pp. 3391-3745], z'òzWem, 1982. XII. Varuks-Ùùt, [pp. 3746- 
4106], /tefem, 1982. 

Manninen 

1925 Ilmari Manninen, Kreevini rahvariie ja selle etnografiline sugulus, in «Eesti rahva 

museumi aastaraamat» I (1925) 128-133. 

Manzelli 

1987 Gianguido Manzelli, Corso istituzionale di filologia ugrofìnnica 1986-87. Appunti 

raccolti, ordinati ed integrati da Manuel Barbera, Pavia, inedito, 1987. 

Marello 

1979 Carla Marello, Anafora, in Mortara Gara velli 1979, pp. 147-221 . 

MaSzFE -► LAKÓ et ahi 1967-78 

Mayrhofer 

1953-80 Manfred Mayrhofer, Kurzgefafite etymologisches Wòrterbuch des Altindischen \ A 
Concise Etymological Sanskrit Dictionary, Heidelberg, Cari Winter Universitàtsverlag: 
Band I. A-H, 1956 [1. Lief., 1953 (i-xxxv + 1-48); Lief. 2, 1954 (49-128); Lief. 3, 1954 
(129-208); Lief. 4, 1955 (209-288); Lief. 5, 1955 (289-368); Lief. 6, 1956 (369-448); 
Lief. 7, 1956 (449-528); Lief. 8, 1956 (529-570)]; Band IL D-M, 1963 [Lief. 9, 1957 (1- 
80); Lief. 10, 1957 (81-160); Lief. 11, 1958 (161-240); Lief. 12, 1958 (241-320); Lief. 
13, 1959 (321-400); Lief. 14, 1960 (401-480); Lief. 15, 1961 (481-560); Lief. 16, 1962 
(561-640); Lief. 17, 1963 (640-700)]; Band III. Y-H. Nachtràge und Berichtigungen, 
1976 [Lief. 18, [1964] (1-80); Lief. 19, 1967 (81-160); Lief. 20, 1968 (161-240); Lief. 
21, 1970 (241-320); Lief. 22, 1970 (321-400); Lief. 23, 1972 (401-480); Lief. 24, 1972 
(481-560); Lief. 25, 1974 (561-640); Lief. 26, 1976 (641-808)]; Band IV. Register unter 
Mitarbeit von Heinz Dieter Pohl, Rùdiger Schmitt und Rinald Zwanziger, 1980 (viij + 
384). "Indogermanische Bibliothek. Zweite Reihe. Wòrterbùcher". 

Melchert 

2009/7 Craig Melchert, Deictic pronouns in Anatolian, in Yoshida - VlNE 2009, pp. 151-161. 
Preprint online: http: //www. linguistics.ucla.edu/people/Melchert/kyoto.pdf. 

Mortara Gara velli 

1979 Bice Mortara Garavelli, Il filo del discorso, con un saggio di Carla Marello: Anafora, 

Torino, G. Giappichelli Editore, 1979. 

NSuS -+ Sadeniemi 1967 

OlNAS 

1955 Felix J. Oinas, The Votes, Indiana - New Haven, Indiana University - Human Relations 

Area Files, 1955 "Subcontractor's Monographs. HRAF 11, Indiana 43" S-4,5 RG4. 

Ojansuu 

1922 Heikki Ojansuu, Itàmerensuomalaisten kielten pronomioppia, Turku, 1922 "Turun 

suomalaisen yliopiston julkaisuja" B. I. 3. 

Onga 

2000 Professor Paul Ariste biobibliograafìa 1921-2000 \ Professor Paul Ariste: Biobiblio- 



graphie 1921-2000, koostanud Mare Onga, Tartu, Tartu Ulikooli Raamatukogu, 2000. 

ÒPIK 

1970 Elina Òpik, Vadjalastest ja isuritest XVIII saj. lòpul. Etnograafìlìsì ja lingvistilisi 

materjale Fjodor Tumanski Peterburi Kubermangu kirjelduses, toimetanud A. Viires, 
Tallinn, Kirjastus "Valgus", 1970. 

Paasonen 

1906 H[eikki] Paasonen, Die finnischen Pronominalstàmme jo- und e-, in «Finnisch-ugrische 

Forschungen» VI (1906) 1 1 14-116. 
1906a H. Paasonen, Ùber den ursprùnglichen Anlaut des finnischen Demonstrativpronomen se-, 

in «Finnisch-ugrische Forschungen» VI (1906) 211-212. 
Pajusalu 

1995 Renate Pajusalu, Pronominit see, temay'a ta viron puhekielessà, in «Sananjalka»XXXVII 
(1995)81-93. 

1997a Renate Pajusalu, Is there an Artide in (Spoken) Estonian?, in Erelt 1997, pp. 146-177. 
1997b Renate Pajusalu, Eesti pronoomenid I Ùhiskeele see, too ja tema/ta, in «Keele ja 

Kirjandus» (1997) 1 24-30 e (1997) 2 106-1 15. 
1999 Renate Pajusalu, Deiktikud eesti keeles, Tartu, 1999 "Dissertationes Philologiae 

Estonicae Universitatis Tartuensis" 8. Disponibile anche online alla pagina 

http: //haldjas . folklore . ee/ seminar /deiktikud/ si sukord.htm. 
2003 Renate Pajusalu, The demonstrative pronoun system in South Estonian: some cognitively 

and culturally determined features , in Suihkonen - Comrie - Maksimov 2003, pp. 146- 

152. 

Palmeos 

1956 Paula Palmeos, Eesti keele pronoomenist enese ~ enda, in «Emakeele Seltsi 

Aastaraamat» II (1956) 106-123. 

Paulson 

1984/62 Ivar Paulson f, Die Woten. Aus der Geschichte eines erloschenen ostseefìnnischen 

Volkes, in «Finnisch-ugrische Mitteilungen» Vili (1984) 99-110; edizione aggiornata da 

Futaky Istvàn. Già in «Baltische Hefte» (1962) 96-105. 

Peirce 

1906/31-58 Charles Sanders Peirce, Prolegomena to an Apology far Pragmaticism, in «The 
Monist» XVI (1906) 4 492-546; poi in Collected Papers of Charles Sanders Peirce, 8 
volumes, vols. 1-6, eds. Charles Hartshorne and Paul Weiss, vols. 7-8, ed. Arthur W. 
Burks, Cambridge (Mass.) Harvard University Press, 1931-1958, voi. IV. 

1980 -> Bonfanttni ef a/i'i 1980. 

2003 -> Bergman - Paa vola 2003 

Petófi 

1988/96 Petòfi Jànos S[àndor], La lingua come mezzo di comunicazione scritta: il testo, in 
Petófi - Vitacolonna 1996, pp. 66-107 [Prima edizione: Urbino, 1988, Centro 
internazionale di semiotica e linguistica dell'Università di Urbino; poi anche in inglese 
in An Encyclopedia of Language, edited by N[eville] E. Collinge, London - New York, 
Routledge, 1990, 1 7 pp. 207-243]. 

2004 Petòfi Jànos S[àndor], Scrittura e interpretazione. Introduzione alla testologia semiotica 
dei testi verbali, Roma, Carocci Editore, 2004 "Università" 613. 

Petòfi - Vitacolonna 

1996 Sistemi segnici e loro uso nella comunicazione umana. 3. La testologia semiotica e la 
comunicazione multimediale, a cura di Jànos Sjandor] Petòfi - Luciano Vitacolonna, 



Sic: Petòfi Jànos Sàndor, evidentemente rassegnato acche la lòl lunga dell'ungherese venga bistrattata dagli editori italiani, per prevenire 
maggiori danni si firma ormai in italiano "Jànos Petòfi". 
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Macerata, Università di Macerata, 1996 "Dipartimento di filosofia e scienze umane. 
Quaderni di ricerca e didattica" 17. 

POKORNY 

1959-69 Julius Pokorny, Indogermanisches etymologisches Wòrterbuch, Bern und Mùnchen, 
Francke Verlag, I. Band 1959, II. Band 1969. 

Posti - Suhonen 

1980 Vatjan kielen Kukkosin murteen sanakirja. Ainekset kerànnyt Lauri Posti. Painokuntoon 

toimittanud Seppo Suhonen Lauri Postin avustamana, Helsinki, Suomalais-ugrilainen 
Seura, 1980 "Lexica Societatis Fenno-Ugricae" 19, "Kotimaisten kielten tutkimuskes- 
kuksenjulkaisuja" 8. 

POTAPKIN - IMJAREKOV 

1949 C[/renaH] rfpnropbeBHH] FIoTanKHH - A[Hjpeil] K[oHCTaHTHHOBHH] HMJipeKOB, 

MoKiuancKo - pyccxuu c/ioeapb, okojio 17.000 cjiob, noj pe^aKirHeÉ ^[mhtphji] Bfjia^H- 
MnpoBHya] Ey6piixa, MocKBa, rocynapcTBeHHoe H3naTejibCTBO HtiocTpaHHbix h 
HaiiHOHanbHbix CjioBapeii, 1949 "Mopaobckhìì HayHHO-HccjieAOBaTejibCKHH Hhcthtyt 
H3biKa jiHTepaiypbi h hctophh npn CoBeTe Mhhhctpob Mop^obckoh ACCP". 

Prisciani Grammatici Caesariensis Institutionum grammaticarum libri XVIII: Grammatici latini ex 
recensione Henrici Keili. Voi. II: Prisciani Institutionum grammaticarum libri I-XII ex 
recensione Martini Hertzii, Lipsiae, in aedibus B. G. Teubneri, 1855, Voi. Ili: Prisciani 
Institutionum grammaticarum libri XIII-XVIII ex recensione Martini Hertzii; Prisciani 
opera minora ex recensione Henrici Keilii, Lipsiae, in aedibus B. G. Teubneri, 1859. 

Prokof'eva 

1966 E[KaTepHHa] ^[MHTpHeBHa] FIpoKocJjbeBa, Ce/ibKyncKuu H3UK, in JaNSSSR III, 396-415. 

Quine 

1961 Willard van Orman Quine, From a Logicai Point of View, New York, Harper and Row, 

1961. 

PvÀNK 

1960 Gustav Rànk, Vatjalaiset. Mit einer deutschen Zusammenfassung (Die Woten), Helsinki, 

Suomalais Kirjallisuuden Seura, 1960 "Suomalaisen kirjallisuuden seuran toimituksia" 

267. 

PvAUN 

1988 Alo Raun, Proto-Uralic Comparative Historical Morphosyntax, in SlNOR 1988, pp. 555- 

571. 

RÉDEI 

1986-88 Rédei Kàroly, Uralisches etymologisches Wòrterbuch. Unter Mitarbeit von Bakró-Nagy 
Marianne, Csùcs Sàndor, Erdély Istvàn f, Honti Làszló, Kerenchy Eva f , K. Sai Eva und 
Vértes Edit, Wiesbaden, Otto Harrassowitz: Band I. Uralische und finnisch-ugrische 
Schicht, 1988 [Lief. 1, 1986 O'-xlviij + 1-84); Lief. 2, 1986 (85-212); Lief. 3, 1986 (213- 
340); Lief. 4, 1987 (341-468); Lief. 5, 1988 (469-593)], Band IL Finnisch-permische 
und Jìnnisch-wolgaische Schicht. Ugrische Schicht, 1988 [Lief. 6, 1988 (605-732); Lief. 
7, 1988 (733-906)]. 

Repnau 

2001 Ester Repnau, Eesti keel grammatika, Tallin, Kirjastus Ilo, 2001 [2003 r ] "Ilo mini- 

teatmik". 

ROMBANDEEVA 

1966 E[baokh5i] H[BaHOBHa] PoMÓaimeeBa, MancuucKuu H3UK, in JaNSSSR III, 343-360. 

Saagpakk 

1982 Eesti - inglise sònaraamat \ Estonian - English Dictionary compiled by Paul F. Saag- 
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pakk, with an introduction by Johannes Aavik, New Haven and London, Yale University 
Press, 1982 "Yale Linguistic Series". 

Sabatini 

1966 Francesco Sabatini, Un'iscrizione volgare romana della prima metà del secolo IX, in 
«Studi linguistici italiani» VI (1966) 49-80. 

Sadeniemi 

1967 Nykysuomen sanakirja. Valtion toimeksiannosta teettànyt Suomalaisen Kirjallisuuden 
Seura, pààtoimittaja Matti Sadeniemi, toimitussihteeri Jouko Vesikansa, Porvoo, Werner 
Sòderstròm Osakeyhtiò, 195 1-1 96 li; Lyhentàmàtòn kansanpainos, Porvoo - Helsinki, 
ibidem, 1967 2 [1996 14 ]. 1 1. A-I, ibidem, 1951. II. J-K, ibidem, 1953. III. L-N, ibidem, 
1954. IV. O-R, ibidem, 1956. V. S-Tr, ibidem, 1959. VI. Ts-Ò, ibidem, 1961. 

Salminen 

1928 Vaino Salminen, Vatjalaiset runot, Helsinki, Suomalaisen Kirjallisuuden Seura, 1928, 

eripainos "Suomen kansan vanhoista runoista" IV. 3, pp. 673-780. 

Salve 

2005a Kristi Salve, Paul Ariste and the Veps Folklore, in «Foklore» XXIX (2005) 175-190. 

Online alla pagina http: //www. folklore.ee/folklore/vol29/veps .pdf. 
2005b Kristi Salve, 'Ariste aeg' - The Time of Ariste, in «Foklore» XXIX (2005) 215-217. 

Online alla pagina http: //www. folklore.ee/folklore/vol29/news .pdf. 

Saussure 

1916/67/95 Ferdinand de Saussure, Cours de linguistique generale, publié par Charles Bailly et 
Albert Séchehaye, avec la collaboration de Albert Riedingler, édition critique préparée 
par Tullio de Mauro, postface de Louis-Jean Calvet, Paris, Payot, 2001 r [19953, 1972i] 
"Grande bibliothèque Payot". Edizione originaria: ibidem, 1916. Edizione italiana: 
Corso di linguistica generale, introduzione, traduzione e commento di Tullio De Mauro, 
Roma - Bari, Laterza, 1967i. 

Sebeok 

1998 Thomas A. Sebeok, The Estonian Connection, in «Er||u,siOTiKf|. Sign Systems Studies» 

XXVI (1998) 20-41; disponibile anche online alla pagina http://www.ut.ee/SOSE/ 

sss/articles/sebeok_26 . htm. 

SlNOR 

1988 The Uralic Languages. Description, history and foreign influences, edited by Denis 

Sinor, Leiden - New York - Kobenhavn - Kòln, E. J. Brill, 1988 "Handbuch der 

Orientalistik"VIII.l. 

SKES -> TOIVONEN et ahi 1955-78 

S QUARTINI 

2007 Mario Squartini, A Comparative Approach to the Phoric Nature ofthe Indefinite/NEW - 

this, in Korzen - Lundquist 2007, pp. 161-168 . 

SVeJa — ► Zaiceva - Mullonen 1972 

SuEnS -► Alanne 1956 

SUHONEN 

1984 Seppo Suhonen, Wotisch oder Ingrisch ?, in Dialectologia Uralica. Materialien des 

ersten Internationalen Symposions zur Dialektologie der uralischen Sprachen 4. - 7. 
September 1984 in Hamburg, herausgegeben von Wolfgang Veenker, Wiesbaden, Otto 
Harrassowitz, 1985 "Veròffentlichungen der Societas Uralo-Altaica" Band 20, pp. 139- 
148. 
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SUIHKONEN - COMRIE - MAKSIMOV 

2003 International Symposium on Deictic Systems and Quantifìcation in Languages Spoken in 

Europe and North and Central Asia. Udmurt State University, Izevsk, Udmurt Republic, 
Russia, May 21-24, 2001. Collection ofpapers, edited by Pirkko Suihkonen, Bernard 
Comrie and Sergei Anatol'evic Maksimov (co-ed.), Izevsk - Leipzig, Udmurt State 
University - Max Planck Institute for Evolutionary Anthropology, 2003 . 

Szabó 

1961 Szabó Laszló, Vót szóvegek Mati faluból, in «Nyelvtudomànyi kòzlemények» LXIII 

(1961)111-127. 

SZEMERÉNYI 

1985/80/70 Oswald Szemerényi, Introduzione alla linguistica indeuropea. Edizione italiana 
interamente riveduta e aggiornata dall'autore, a cura di Giuliano] Boccali, V[ermondo] 
Brugnatelli, M[ario] Negri, [Milano], Edizioni Unicopli, 1985 "Collana di linguistica 
storica e descrittiva" 1 . Edizione originale Einfuhrung in die vergleichende Sprachwis- 
senschaft, Darmstadt, Wissenschaftliche Buchgesellschaft, 1980 2 (1970j). 

Tauli 

1973-83 Valter Tauli, Standard Estonian Grammar. Part I Phonology, Morphology, Word 
Formation. Part II Syntax, Uppsala, [Universitetsblioteket], 1973 (I) e 1983 (II) "Acta 
Universitatis Uppsaliensis. Studia Uralica et Altaica Uppsaliensia" 8 e 14. 

Tepljasina 
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Una introduzione ai NUNC: 
storia della creazione di un corpus*. 



Theforms ofthe Orange tree, the Cocoa nut, the Palms, the 
Mango, the Banana, will remain clear & separateci, but the 
thousand beauties, which unite them ali into one perfect scene, 
must perish: yet they will leave, like a tale heard in childhood, 
a picture full ofindistinct, but most beautyful figures. 

Charles Darwin, Diary ofthe Voyage ofH.M.S. 
Beagle, 1836 August 6th, Bahia. 



0. Excusatio NON petita. La ragione principale della mia presenza liminare, forse più che 
altro simbolica, rispetto alla serie di ricerche che si andrà qui a svolgere è che sono, ebbene sì, 
almen questo, il padre dei NUNC: il primo iniziatore, cioè, di una ormai lunga catena di eventi, di 
cui non ultimi quelli qui in oggetto; il mittente, cioè, al quale, pur talora incolpevole, non mancherà 
a molti la tentazione di rispedire ogni addebito. E sia. 

E poche chiacchiere introduttive a NUNC e newsgroup è tutto quello che vi ammanirò, senza 
molte altre pretese. 

1. Nascita dei NUNC. Elaborai, infatti, il progetto dei NUNC (acronimo di Newsgroup 
UseNet Corpora) nell'estate 2002 in bmanuel.org (l'organizzazione che ho fondato: cfr. Barbera 
2007a), anche se indovinai le potenzialità dei newsgroup ed incominciai i primi download 
sperimentali di testi già nell'inverno 2001. 

Vi erano allora solo due precedenti: (1) il tedesco ELWIS (cfr. Hinrichs et ahi 1995 e Feldweg 
- Kibiger - Thielen 1995), storicamente assai importante non fosse perché è stato coinvolto nella 
creazione del vecchio e glorioso Stuttgart-Tùbingen Tagset (STTS) per il POS-tagging del tedesco, 
tutt'ora largamente usato; (2) il CMU Text Learning Group Data Archive di Tom Mitchell del 1993, 
comunemente noto come 20 Newsgroups, che non è però un vero precedente poiché, a norma della 
definizione che correntemente uso di corpus (e che riporto qui sotto), non è realmente un corpus, 
ma bensì una collezione di testi predisposta per machine learning. 



* Una prima versione di questa breve introduzione fu dapprima presentata alle Giornate di studio: Scritto e parlato, 
formale e informale. La comunicazione mediata dalla rete. Torino, 29-30 ottobre 2010; una seconda versione fu poi 
presentata ad un incontro presso l'Istituto di italianistica dell'Universitàt Basel il 20 maggio 2011; un adattamento 
francese, infine, dal titolo Une introduction au NUNC: histoire de la création d'un corpus è stato pubblicato in Variétés 
syntaxiques dans la variété des textes online en italien: aspects micro- et macrostructuraux, èdite par Angela Ferrari e 
Letizia Lala, Nancy, Université de Nancy II - Editions universitaires de Lorraine, 201 1 ="Verbum" XXXIII (201 1) 1 " 2 9- 
36. Questa versione italiana è inedita. 

1 Su forestierismi e prestiti adattati e non in italiano ho largamente argomentato in BARBERA 2009, pp. 7-13 (§ 1.4 La 
resa dei forestierismi in italiano; cfr. anche BARBERA 2003), e non giova qui ripetermi, se non per dire che mi 
conformerò in tutto alle decisioni allora prese. 
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Raccolta di testi (scritti, orali o multimediali) o parti di essi in numero finito in formato 
elettronico trattati in modo uniforme (ossia tokenizzati ed addizionati di markup 
adeguato) così da essere gestibili ed interrogabili informaticamente; se (come spesso) le 
finalità sono linguistiche (descrizione di lingue naturali o loro varietà), i testi sono 
perlopiù scelti in modo da essere autentici e rappresentativi. 

Tav. 1 . La definizione di corpus secondo Barbera - Curino - Onesti 2007b, p. 70 e Barbera 2009, p. 1 26. 

Entrambi, però, usavano, per i loro diversi scopi, i newsgroup meramente come comodo serbatoio 
di testi, non in qua tale. Cosa che invece era precisamente il mio intento. 

2. I NEWSGROUP per I NUNC. In breve «un newsgroup è un forum telematico a libero 

accesso, gratuito, disponibile su Internet, che si manifesta nella forma di testi scritti, ed il cui 
funzionamento è assai semplice: ogni utente scrive un messaggio, il post, e lo invia ad una specie di 
"bacheca elettronica" mantenuta presso una rete di server (i newsserver che costituiscono UseNet), 
dai quali gli altri utenti del gruppo possono scaricarlo, leggerlo e rispondervi, costruendo anche 
articolate catene (thread) di botte e risposte. La facilità d'uso garantisce la grande diffusione dello 
strumento tra le categorie più diverse di utenti e giustifica la grande quantità di traffico esistente su 
UseNet. Queste "bacheche elettroniche" che sono i newsgroup sono poi articolate in una tassonomia 
precisa, ossia in un sistema di cornici argomentative che si chiamano "gerarchie", a base 
geografico-nazionale e/o tematica; anche queste gerarchie, peraltro, nascono dal basso in base alla 
iniziativa degli utenti» (Barbera 2007a, p. 8). 
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Tav. 2. Porzione iniziale della gerarchia it.*: (a) struttura arborescente e (b) tabulato lineare dei newsgroup. 

Non è qui, infatti, la sede per ritracciare la storia di Usenet, dalla istituzione delle cosiddette Big 
Eight , gerarchie tematiche in lingua inglese, alla nascita delle varie gerarchie "nazionali": è storia 
ormai sotto gli occhi di tutti, raccontata e riassunta mille volte sul web. Quello da cui il mio 
progetto iniziale era partito era invece proprio l'esistenza di queste gerarchie geonazionali, quasi 



«E - come dicevo in Barbera 2011/08, n. 20 - l'attualità ed irrinunciabilità della coppia concettuale (e quindi, in 
seconda istanza, anche terminologica) token-type è confermata anche da bibliografia recente come Wetzel 2009». 
3 E cioè: comp., news., sci., humanieties ., soc, talk., mise, più l'anarchica alt.: cfr. ad es. CORINO 2007, 
pp. 225-227. 
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sempre "in lingua" ed articolate tematicamente solo al loro interno, un'idea di cui potete avere dalla 
tavola 2 qui sopra, che riproduce l'inizio della gerarchia ufficiale italiana, it . 



■fi Agent - [it.arti.musica.classìca] 



Edit Online Post Navigate Group Message Options Window Help 



\n\x} 



J^^ 



W^|TÌHsafe|5B®|^fi©E|[^ %% | * <& # O | e/ 



AH Groups 



105822 



°l 



~H 



Stati |B> Lines Subject ffii| Ali Messages 



Author 



Date * 



°l 



T3 



65535 it. 

463 it. 

it. 



arti, fumetti, bonelli 
arti, fumetti, manga 
arti.hiphop 
arti, musica 

arti, musica, cantautori 
-af'i rn'.i.i": j "ila. :k j 
arti.musica. classica, mod 
arti, musica. jazz 



...2... 



30 Musicisti cercatisi. Andrea Vari; 27/09/2009 10.21 

10 gradita sorpresa al Massimo di Palermo Galdarella 27/09/200910.37 
i-j II velo nome di Monteveidi Paolo r ijr,,-a .7 -mh ■ JuuH in 5u 



J 



25 Pasquale Diano Marina 
17 Paolo Tramannoni 

42 Shapiro used clothes 

1 7 Shapiro used clothes 

5 Ivan 



27/09/200911.24 
27/09/200911.41 
27/09/200912.05 
27/09/200912.27 
27/09/200917.38 



\s\ Il vero nome di Monteverdi Paolo Tramannoni 27/09/2009 10. 50 



°l 

1 



Ciao a tutti. 

Sapevo che tornare all'università mi avrebbe offerto l'opportunità di 
fare nuove scoperte e fi si sterna re la mia claudicante cultura generale. 
Ne ho la conferma mentre leggo il manuale di letteratura italiana di 
Casadei e Santagata, pubblicato da Laterza. 

Intanto, i due docenti di Pisa (e di probabile origine emiliana) mi 
hanno insegnato, da non toscano od emiliano, a stare al mio posto: dal 
testo è stato scentemente espunto il nome di ogni luogo insignificante 
per la storia della letteratura italiana, cioè ogni città che si trovi 
al di fuori di Toscana ed Emilia (includendo nella damnatio, ad esempio, 
Roma, Milano, Venezia ed Urbino: e dunque Castiglione scrive in volo 
sul Cippo grifo, la cittadinanza dell'intrigante Valla va tenuta segreta, 
Crescimbeni se ne stia confinato nella sua Arcadia ideale, Ànnibal Caro 
chissà da che sperduta città delle Marche scriveva ■ e, soprattutto, 
degli scritti del rinnegato Leonardo si deve accuratamente evitar di 
parlare). 

Ma la scoperta per me fondamentale arriva quando si parla dei musicisti 
che hanno affrontato le operare di Tasso. Anche in questo caso, i due 
autori mi avevano già messo a posto, eliminando la musica dalla loro 
storia come elemento estraneo alla letteratura, ricordandomi che la 
musica non conta, e continuerà a non contare niente al di fuori 
dell'happy hour (del resto, il loro predecessore Roncaglia non aveva 
scritto già nel 1 97S di un "divorzio tra musica e poesia" avvenuto nel 
Duecento?) 

Scopro dunque che la corretta grafia di Lully è Lulli, con un vezzo da 
filologi militanti e intransigenti (ma non privi di ironia, visto che lo 
si definisce, per alimentare il gioco di specchi, "musicista francese"). 
E che il vero nome di Monteverdi, quello del Combattimento, è Angelo. 
Sì, Angelo Monteverdi si legge a pagina 21 7. 

Per oggi posso smettere, sapendo che la mia formazione culturale sta 
certamente progredendo. 

Ciao, 
Paolo 



J 
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Finished retrieving bodies. 

Tav. 3. Una schermata del newsreader Agent 4 : in alto a destra le gerarchie (con il numero dei post), 
in alto a sinistra i thread dei post (col il numero di righe per post), ed in basso il testo del post. 

In bmanuel.org ho scaricato materiali (dal 2002 ad oggi con varia completezza ) per croato 
(hr.), danese (dk.), estone (ee.), finnico (sf ., ecc. ), francese (fr.), inglese (britannico, uk. e 
free.uk., ed australiano, au.), italiano (it., free.it., it-alt., ecc. 9 ), norvegese (no.), 
olandese (ni . , ecc.), polacco (pi . e f ree .pi . ), portoghese (continentale, pt . , e brasiliano, br . ), 
slovacco (sk.), spagnolo (di Spagna, es. e cileno, chile.), tedesco (de., ecc.) ed ungherese 



Il post riprodotto (dal newsgroup it.arti.musica.classìca), conformente all'interesse di VALERE per i 
"registri alti", è, appunto, di questo tipo. Ma non troppo ... 

5 Col programma (newsreader) Agent della Forte: cfr. la Tav. 3. 

6 Naturalmente dei soli newsgroup testuali. Molta parte del traffico su Usenet avviene infatti nei newsgroup cosiddetti 
binari, in cui invece che testo possono venire postati allegati di varia natura (prevalentemente immagini o filmati 
pornografici, ma non solo), rigorosamente esclusi dai newsgroup testuali. 

7 Utilizzando fino ad otto newsserver contemporaneamente: Giganews, Newsreader, Supemews, Newshosting, Active- 
news, Newsfeeds, Individual.de e X-privat. 

Menziono solo le gerarchie principali. 
9 Per le ragioni di questa molteplicità di gerarchie, cfr. infra § 6.1. 
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(hu . ). Lo studio delle grandi gerarchie tematiche sovranazionali, linguisticamente, potrebbe essere 
interessante a vagliare l'esistenza o meno di quell'inglese "globale" lanciato da Crystal: ma, non 
sentendomi probabilmente nel cuore abbastanza anglista, è il guanto di una sfida che non mi sono 
ancora sentito di raccogliere . 

I NUNC costituiscono così una innovativa suite multilingue (in cui l'italiano è solo il cuore) di 
corpora costituiti con i testi dei newsgroup. 

3. Dura Lex. Il problema dello status legale dei corpora, e quindi quello della loro libera 

accessibilità, ha sempre rappresentato una mia personale ossessione, che ho cercato di trasmettere a 
tutto il gruppo di ricerca che ruota intorno a bmanuel.org ed a quello (in larga parte coincidente) 
dell'Università di Torino che ruota intorno a Carla Marello e me: le conclusioni di ciò (sia per 
quanto riguarda l'acquizione dei testi e le licenze dei corpora, con riferimento all'esperienza di 
GNU nel software e del copyleft in genere) sono state compendiate in Barbera - Corino - Onesti 
2007a: cfr., in particolare, le riflessioni riassunte riassunte in Allora - Barbera 2007; la 
definizione legale della situazione in Zanni 2007; e le "soluzioni" contrattuali presentate in 

ClURCINA - RlCOLFI 2007. 

Ora, «UseNet per definizione e tradizione è il regno del pubblico dominio, quindi [la 
disponibilità legale del materiale] sembrerebbe una ovvia assunzione; in realtà, se lo si dovesse 
sostenere legalmente, le cose potrebbero non essere così pacifiche (talvolta si è ricorso ad un 
cosiddetto "diritto implicito"), ma dato che il comune sentire sostiene comunque la nostra bonam 
fidem, e che non vi sono ad ogni buon conto interessi rilevanti lesi, è certo assai improbabile che 
contestazioni significative possano essere sollevate. In effetti sono anni che Google mantiene 
commercialmente archivi di newsgroup senza che ciò sia avvenuto» (Barbera 2007a, p. 8 in nota). 

3.1 Effetto copyleft. Ciò assunto, tutti i NUNC sono stati licenziati da bmanuel.org (che 
ne è il soggetto proprietario) con licenza Creative Commons Share Alike (cfr. ClURCINA - RlCOLFI 
2007), il che ne garantisce la libera diffusione a chiunque (ad esempio a corpora.unito.it, che ne è il 
distributore principale) purché i risultati derivati dal lavoro su questi corpora siano rilasciati con la 
medesima licenza (copyleft): siano cioè resi pubblici alle stesse condizioni. 

I NUNC sono così diventati la base testuale per molti progetti, almeno due dei quali hanno visto 
me o studiosi della nostra scuola tra i proponenti e partecipanti: in primis il FIRB RBAU014XCF 
"L'italiano nella varietà dei testi. L'incidenza della variazione diacronica, testuale e diafasica 
nell'annotazione e interrogazione di corpora generali e settoriali", coordinatore nazionale Carla 
Marcilo (i cui risultati sono stati affidati alla distribuzione di corpora.unito.it); ed attualmente anche 
il progetto VALERE (Varietà Alte di Lingue Europee in REte), Regione Piemonte Bando Scienze 
umane e sociali 2008. 

3.2 Effetto testuale. Un grave limite, spesso lamentato in molti corpora "più o meno" 
disponibili 2 ma il cui status legale è più incerto dei nostri, è la limitata fruibilità del contesto, cosa 
che li ha resi perlopiù inutilizzabili per ricerche di tipo testuale. Con la conseguenza che linguistica 
dei corpora e linguistica testuale si sono sostanzialmente ignorati fino a tempi recenti. 

II problema mi ha colpito particolarmente, non solo perché l'antica amicizia con la sempre 
compianta Maria-Elisabeth Conte ha impresso la testualità nel DNA mio come di tutti quelli che la 
conobbero , ma soprattutto perché, teoreticamente, mi sono sempre più convinto che una corretta 
definizione dei fondamenti della linguistica dei corpora (così come del nodo storiografico, 
fondamentale, dei rapporti tra strutturalismo e generativismo) non può prescindere dalla corretta 
comprensione ed individuazione del livello testuale del linguaggio (cfr. un primo affondo in 



10 Per ora sono stati effettuati scarichi sperimentali ma continuativi solo per alcune aree tematiche di mio più diretto 
interesse: musica classica, enogastronomia, filosofia, fonts. 

11 Per l'italiano si pensi ad esempio al CORIS. 

12 Valori, anzi, che Carla Marello ed io abbiamo cercato di trasmettere alle più giovani componenti del nostro gruppo, 
che più non ebbero la fortuna di conoscerla in persona. 
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Barbera 2011 § 1.2.2: ma intendo svolgere in futuro l'argomento in una apposita sede 
monografica). 

La precoce diagnosi del problema pratico legale-testuale di cui sopra, ad ogni buon conto, ha 
consentito di porvi prestamente rimedio (cfr. Barbera 2009 § 2.2.3 p. 22), tanto che della recente 
inversione di tendenza credo di avere una diretta responsabilità, essendo tutti i corpora da me 
prodotti od ispirati, NUNC in testa, legalmente sicuri, e quindi fruibili senza limitazioni alcune, 
tantopiù di contesto, che è sempre allargabile fin all'intero testo. A prova di ciò si vedano le ormai 
molte applicazioni testuali prodotte dalla nostra scuola e, soprattutto, da quella dei testualisti di 
Basilea, come ad esempio quelle raccolte in Barbera - Corino - Onesti 2007a. 

4 Le attrattive dei newsgroup. Molte ragioni, come accennavo (cfr. § 1), mi facevano 

desiderare di studiare i newsgroup in quanto tali. Alcune sono ovvie (la grande abbondanza testuale; 
l'organizzazione in gerarchie nazionali che è garanzia di uniformità diacorica; la verosimile 
disponibilità legale del materiale, ecc.), sicché basta avervi cursoriamente accennato. Altre forse 
meno, sicché vale la pena di spendervi qualche parola. 

4.1 Folk taxonomy ed enciclopedia popolare. Una delle caratteristiche più interessanti 
dei newsgroup è che nascono sempre dal basso in base alla iniziativa degli utenti stessi: la decisione 
di quali tematiche debbano ricevere una propria bacheca, e di come le bacheche si organizzino 
all'interno di un dato dominio (nazionale o linguistico) non è decisa dall'alto da una qualche 
autorità (ministeri, accademie, "specialisti" o lobbies di varia natura). 

L'effetto è che una gerarchia di geonazionale di newsgroup si presenta così come una sorta di 
"enciclopedia popolare" di una data cultura, un vero ritratto spontaneo della società che l'ha 
prodotta. Ciò la rende, linguisticamente, di speciale interesse lessicografico, tanto per lo studio dei 
neologismi, quanto per quello dei lessici specialistici, aspetti che furono sfruttati soprattutto per il 
FIRB "L'italiano nella varietà dei testi". 

Dei molti interessi sociologici ed antropologici che ovviamente suscita un simile fenomeno, 
dobbiamo qui in genere sorvolare. Ma almeno di uno non possiamo completamente tacere, visti i 
costanti intrecci che l'antropologia ha sempre tessuto con la linguistica (si pensi anche solo a Sapir 
ed alla sua tradizione): questa "enciclopedia popolare" assomiglia molto nella sua organizzazione 
ad una folk taxonomy; non a caso comune alle folk taxonomies ed ai newsgroup è l'organizzazione 
gerarchica. Il tema è da tempo ben noto agli antropologi (risale, nientemeno, a Durkheim 1912), e 
si è specializzato soprattutto nella etnobotanica e nella etnobiologia in genere (tra la molta 
bibliografia cfr. almeno Berlin et ahi 1973, Brown 1986 e Healey 1993). Scenari più generali 
(«se ne sono infatti già avute interessanti e più generali applicazioni cognitive alla "antropologia 
della scienza" tout court (cfr. Atran 2001)», come notava Corino 2007, p. 242 nota 23) sono però 
ben ipotizzabili, e dai NUNC, credo, potrebbe venire un importante contributo. 

4.2 Umgangssprache. La natura testuale e diamesica dei post dei newsgroup è cosa che ha 
richiesto parecchie riflessioni. Il quadro generale per le CMR (Comunicazioni Mediate dalla Rete) è 
stato approntato da Adriano Allora (cfr. Allora 2005 e 2009), ed in base a questo, e talora al 
modello complementare di Koch-Oesterreicher, una prima sistemazione del problema è stata data 
da Corino 2007, che ne sottolineava anche la amplissima forbice di registri, tra quelli alti, 
saggistici (oggetto privilegiati del progetto VALERE) e quelli informali al limite della chat. 
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g) Re:lol pùgÀgfròf 03/04/2J007 2.36 

"Calsifer" < ss@ss > ha scritto nel messaggio 

news: 461 7746D$OÌ36439ì4fafbaef@reader5.news.Hn.it.. . 

> 

> "pugÀ^iof" < alfredo2@oaseta.pl > ha scritto nel messaggio 

> news:ev6pql$4tp$1@inews.aazeta.pl.. . 

> > 

> > "Calsifer" <ss@_ss> ha scritto nel messaggio 

> > news: 461 501 1 1 $0$4797$4fafbaef@reader4.news. tin.it.. . 

> >> 

> >> "pugA®Tof" < alfredo2@gazeta.pl > ha scritto nel messaggio 

> >> news: eutvpbìhr3$1 @inews. gazeta.pl.. . 

> >> > ! 

> >> > 

> >> > 

> >> Che loffi? 

> >> 

> >> 

> > 

> > lollo xchè con tutto questo casino mi è impossibile concentrarmi.. 

> > 

>> V 

> > 

> Ma ciao!! 

> Che casino? 
> 

> > ciao fatina, 

> > felicissima Pasqua!!!! 

> > 
> 

> 

> Grazie!! Anche a te felicissima Pasqua!! Smack!! 

> V 
> 

> > (e la prox volta che fai sesso pensami!) 

> > 

> > 

> > 
> 
>0_0 

> 
> 

0_0 

non fai sesso e non mi vuoi pensare? 

non fai sesso ma mi vuoi pensare? 

fai sesso e non mi vuoi pensare? 



Tav. 4. Un post "informale", del tipo escluso da VALERE, dal newsgroup free-it^amciartar' 3 

Su questa questione generale preferirei non ritornare qui, sostando semmai su una caratteristica 
di questa (queste?) varietà. In Barbera 2007a, p. 8, parlavo per i newsgroup di «una 
Umgangssprache assolutamente contemporanea e reale molto variata per registri e temi», 
precisando in nota «La nozione è vetusta, legata soprattutto alle problematiche sorte intorno al 
cosiddetto "latino volgare" tra i grandi patres della romanistica; già lo Spitzer, inoltre, in diversa ma 
confrontabile ottica, la aveva applicata all'italiano ("italienische Umgangssprache": cfr. Spitzer 
1922/2007); e, comunque, è stata riproposta anche recentemente (cfr. Kiesler 2006). L'analogia 
sembra abbastanza buona, in quanto si tratta, molto in soldoni, di una lingua comune, usuale e 
media, non tematicamente o sociologicamente delimitabile, più vicina al parlato ma di fatto scritta, 



13 Si noti, peraltro, come l'esempio sia strutturalmente assai interessante: ad una prima proposta il cui testo contiene 
solo un «!», seguono due battute dal contenuto irrilevante, una domanda disattesa, degli auguri di Pasqua, ed un paio di 
innocui scherzi sessuali. 
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e per la quale, in realtà la dicotomia scritto -parlato non è veramente pertinente». Poi, con, appunto, 
la traduzione italiana del 2007 della Italienische Umgangssprache esplose la spitzermania (non 
saprei come altrimenti chiamarla), e la, peraltro corretta, impostazione di quella nota andava 
ampliata e ribadita in sede monografica, contro le molte "appropriazioni indebite" che di Spitzer si 
stavano facendo: nessuna migliore occasione per fare ciò si poteva presentare della commemo- 
razione nencioniana, del grande maestro padre di ogni "parlato-scritto". 

In Barbera - Marello 2008, infatti, ribadii la centralità della tradizione dei latinisti e dei 
romanisti, culminata con Hofmann, rispetto a quella ballyana, al solito geniale quanto estrampa, 
dello Spitzer, disegnando una prima mappa del ricco humus otto-novecentesco su cui Hofmann e 
Spitzer si innestano, e prendendo le distanze dalla scelta (interpretativa ancor più che traduzionale) 
di rendere Umgangssprache con lingua della conversazione per presentare Spitzer come un 
precursore di Grice (idealmente sovrapponendo Stilkritik e Speech Acts, riducendo il "dialogico" al 
conversational, la Hòflichkeit al Cooperative Principle, ecc., con conseguenze a mio parere nefaste). 

4.3 Thread e quoting. La modalità medesima con cui gli utenti interagiscono tra di loro 

con i vari post crea delle strutture testuali e macrotestuali particolarmente interessanti. I vari post si 
organizzano, infatti, in catene {thread) in cui uno risponde all'altro, a volte allentandosi anche in 
ramificazioni laterali spesso assai lontane dal capocatena. La disponibilità alla ricerca testuale dei 
NUNC ha reso possibile studiare alcuni di questi meccanismi. 



14 Per un cui apprezzamento cfr. GRAFFI 2008. 
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62 Su quali parametri si agisce per "interpretare" ? Gianluca bl ilio 
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Tav. 5. Un thread del newsgroup it. arti. musica classicacome visualizzato dal newsreader Agent. 



15 



Anche se non intendo indugiarvi oltre , potendo rimandandare al molto già pubblicato (cfr. almeno 
Marello 2007 e Costantino - Marello - Onesti 2009), vorrei solo ricordare come questo tipo 
di organizzazione responsoriale di testi e macrotesti, mutatis mutandis, non è una assoluta novità del 
mondo della CMR, trovandosene esempi già nella tradizione romanza medioevale: ad Elisa Corino 
avevo infatti suggerito per il suo importante studio del 2007 di citare il caso della famosa (e 
famigerata) tenzone del sirventese osceno di Arnaut Daniel: 



15 Per la selezione di post "alti" effettuata pensando a VALERE l'esuberanza del fenomeno è peraltro più contenuta che 
non per quelle "medi" e "bassi". 
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Trac Malecs 
[perso] 



\ 



Raimons deDufort [BdT 337,1) 

Trite Malec, a \os me tenk de fama. Ewan capien, 

[-] 



\ 



Trac Malecs [BdT 447,1.1) 

E» Raimon, be-w iene a grat quar ayssi-vs \ei acordai 
de gen captener en Bernal seiha que no respos enfai 
al malasiruc Caersinai, [. . .] 



\ 



Ara aut Daniel [BdT 29,15) 

Pus Raimons e Trac Malecx chapien n 'Ena e sos deex, 
e leu seraì vìeìks e seneex ans que m 'acori en aliali 
pre ex don puesea v enir iati grani pecx: [...] 



\ 



Ralmous deDufort [BdT 44 7,1. II -sgg.) 
Ben es malasirucx dolens lo Caersis a sons grens, [...] 
Amavi escolier, vay mi ancanog o al mail a na Enan, 
e digas li que Raimons de Durfori li di [...], 



Tav. 6. La tenzone tra Truc Malecs, Raimons de Durfort ed Arnaut Daniel su Na Ena. Schema di Corino 2007, p. 235. 

Testi da Contini 1936, pp. 228-30 ed Eusebi 1984, p. 4. 

Tra i fenomeni più interessanti che questa organizzazione responsoriale scatena è quello del 
quoting, ossia la tecnica con cui si riporta (e si cancella) il testo cui si risponde. Un esempio 
(restando nel registro alto selezionato dal progetto VALERE, cui alcuni dei contributi qui presentati 
si riconnettono) potrebbe essere il seguente, ricordo di una non memorabile serata della Scala, in cui 
il noto musicologo Arrigo Quattrocchi risponde ad un denigratore di Donizetti: 

Newsgroups: it.arti. musica. classica. mod 

Subject: La Fille du =?ISO-8859-l ?Q?r=E9giment?= alla Scala 

From: rodolfo.canaletti@tin.it (Rudy) 

Date: Mon, 26 Feb 2007 1 7:45:27 +01 00 

Serata non certo memorabile quella di ieri sera alla Scala. La Fille du | régiment, secondo quanto ne posso capire, è 
un'opera che non offre | grandi emozioni se non quella di contenere alcune arie che richiedono un | grande 
virtuosismo vocale. Già posso dire che questo non rientra nei | miei gusti, in genere molto lontani dal puro 
esibizionismo. | Ma, evidentemente la direzione artistica della scala ha ritenuto, | giustamente credo, necessario 
inserire in una stagione operistica, oltre | a opere d'avanguardia, a opere di grande tradizione, anche opere di | 
caratura più leggera e capaci di soddisfare innanzi tutto gli amanti del | bel canto. | E la Fille du Régiment ha tutti i 
numeri per farlo. | Come struttura operistica è un ibrido: comprende parti recitate, j recitativi veri e propri, arie, pezzi 
d'insieme, etc. Quindi già | diventa difficile stabilire la sua appartenenza alla Opéra-Comique (come | detto dal 
sottotitolo) o all'Opera buffa italiana. In più, riesce | difficile stabilire se di opera buffa vera e propria si tratta o di | 
opera semi-seria, come la presenza di alcune arie struggenti ("Il faut | partir" alla fine del primo atto, e "Par le rang et 
par l'opulence" e | "Pour me rapprocher de Marie" nel secondo) farebbero pensare. La regia | di Crivelli (con scene e 
costumi di Zeffirelli), mi è sembrato che abbia | privilegiato la parte buffa. | 
Tuttavia c'è da registrare un successo solo parziale di questa | operazione-proposta. Il successo (e la 
giustificazione) di tale | proposta, proprio per la natura prettamente belcantistica dell'opera, | dovrebbe essere 
condizionato da un'offerta di qualità di realizzazione | straordinariamente alta: grandissimi interpreti, nuova e 
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rutilante messa | in scena, direttore d'orchestra capace di valorizzare le voci e nel | contempo di trasmettere 
emozione. | Tutto ciò non c'è stato. | L'offerta originale si basava soprattutto su due interpreti che sulla | carta 
dovrebbero essere il meglio che oggi offre il mercato in quanto a | canto di coloratura: Juan Diego Florez e la Natalie 
Dessay. Ma | evidentemente l'ingaggio di queste due "stelle" deve aver finito i | quattrini, perché si è dovuto ricorrere 
a una messa in scena che ha | ormai almeno 30 anni sul groppone, e francamente li dimostra tutti. | A questo primo 
impiccio, se ne è aggiunto subito un secondo (sembra | quasi di assistere a una crisi del governo Prodi!): la Dessay 
ha | (giustamente) ritenuto sconveniente cantare in una messa in scena così | vetusta, e ha ricusato la 
partecipazione. | Quindi alla fine, per sostenere la qualità dell'offerta, è rimasto il | solito JDF che in questi ultimi anni 
non so quante volte abbia | interpretato (bis o non bis) la parte di Tonio. Qualche maligno dice che | in famiglia ormai 
lo chiamino con questo nome :-)). | 

E puntualmente, ieri sera ha fatto capolino la noia. | La messa in scena si avvale di una scenografia stilizzata che | 
ricostruisce un villaggio tirolese nel primo atto, e un salone del | castello nel secondo. I costumi sono divise militari 
dell'esercito | napoleonico per gli uomini, e caricature di "sontuosi" vestiti e | parrucche del primo Ottocento per le 
donne e per i civili. | Il movimenti di recitazione sono spesso spinti fino alla farsa, come i | comportamenti sguaiati di 
Marie, vivandiera nel primo atto, le corse | agilmente ginniche di Tonio, i comportamenti da sturmtruppen dei | 
militari, le prove di ballo e di canto del secondo atto, la storpiata | caricaturale pronuncia dei nomi degli ospiti 
tedeschi, i versacci qua e | là, etc. | La musica e la direzione orchestrale non offrono, almeno a me, alcuno | spunto 
per un commento. | L'interpretazione del canto ha mostrato una Rancatore che ha fatto il | suo dovere senza una 
particolare eccellenza; e un Florez che ha fatto | sì, la sua grande figura (ci sarebbe mancato altro che non la 
facesse!), | ma francamente non mi ha entusiasmato. La celebre aria "Mes amis" | musicalmente nulla di 
eccezionale, ma resa famosa dai sette (o più?) do | di petto, ha avuto più di tre minuti di applausi e roboanti richieste 
di | bis (fortunatamente non concesso), ma si è dimostrata solo un esibizione | muscolare. | Florez secondo me non 
ha una bella voce: il timbro è molto chiaro, direi | adolescenziale (pochi armonici?), il volume piuttosto piccolo. In 
questo | modo, certo, ne guadagna l'agilità, che indubbiamente è moltissima, e | l'estensione verso l'alto. Ma ne 
perde la caratura del personaggio. Per | Tonio, personaggio di fatto inesistente, questo può andar bene. Ma ho | 
sentito dire che intende interpretare personaggi veri come il duca di | Mantova. Sarà, ma la cosa mi lascia molto 
scettico. | 

Perfinire, spero di avere un maggior coinvolgimento il 10 marzo con | l'offerta scaligera di una Salome diretta da 
Harding, con la regia di | Lue Bondy. | 
Saluti a tutti | 
Rudy ! | rodolfo.canaletti@tin.it | http://www.dicoseunpo.it 

Newsgroups: it.arti. musica. classica. mod 

Subject: Re: La Fille du régiment alla Scala 

From: "Arrigo Quattrocchi" <ar.quattrocchi@NOSPAMmclink.if> 

Date: Sat, 3 Mar 2007 01 :54:36 +01 00 

"Rudy" <rodolfo.canaletti@tin.it> ha scritto nel messaggio | 
news:1hu5lah.md91ea35magwN%rodolfo.canaletti@tin.it... | 
Serata non certo memorabile quella dì Ieri sera alla Scala. \ 

Nulla posso dire sulla serata, ma rimango perplesso di fronte a numerose | affermazioni. | 
La Fille du \ régiment, secondo quanto ne posso capire, è un'opera che non offre \ grandi emozioni se non quella dì 
contenere alcune arie che richiedono un \ grande virtuosismo vocale. Già posso dire che questo non rientra nei \ 
mìei gusti, in genere molto lontani dal puro esibizionismo. \ 

Nulla da ridire sui gusti, ma non capisco 1) perché il virtuosismo vocale | dovrebbe essere puro esibizionismo e non 
avere, invece, una funzione | espressiva e un ruolo di drammaturgia, 2) quale tipo di emozioni ci si | aspetti da 
un'opera di genere comico, certo non quelle di Tristano e Isotta. | 

Come struttura operìstica è un ìbrido: comprende partì recitate, \ recitativi veri e propri, arie, pezzi d'insieme, etc. 
Quindi già \ diventa diffìcile stabilire la sua appartenenza alla Opera -Comìque (come \ detto dal sottotìtolo) o 
all'Opera buffa italiana. In più, riesce \ diffìcile stabilire se dì opera buffa vera e propria sì tratta o dì \ opera semi- 
seria, come la presenza di alcune arie struggenti ("Il faut \ partir" alla fine del primo atto, e "Par le rang et par 
l'opulence" e \ "Pour me rapprocher de Marie" nel secondo) farebbero pensare. La regìa \ dì Crivelli (con scene e 
costumi dì Zeffìrellì), mi è sembrato che abbia \ privilegiato la parte buffa. \ 

La fille du régiment è a tutti gli effetti una opéra-comique, tanto che per | farla circolare sui palcoscenici italiani 
Donizetti dovette fare numerosi | adattamenti, e la versione italiana non ha mai convinto fino in fondo | proprio 
perché sembra troppo francese. La versione francese ha infatti i | dialoghi recitati, e la presenza dell'elemento 
patetico non è anomala nel | genere francese. La presenza di brani patetici in un'opera comica era | peraltro abituale 
anche in Italia, e proprio Donizetti aveva accentuato | questa contaminazione, basta pensare all'Elisir d'amore. | Il 
patetico, d'altronde, è un fortissimo elemento di contrasto rispetto al | comico, e quest'ultimo punta sull'eleganza e la 
leggerezza, non sulla farsa. | Anche per questo penso che La fille du régiment sia un capolavoro di | drammaturgia, 
comica s'intende, e non sia affatto un'opera di mero | esibizionismo. Forse bisognerebbe cercare di capire i 
meccanismi del comico, | e di | apprezzarli per quello, e non è poco, che possono comunicare al pubblico. | 
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Una postilla sullo spettacolo di Crivelli-Zeffirelli. Credo sia del 1959, e | dunque è credo il più antico spettacolo in 
circolazione sui palcoscenici | italiani e forse stranieri. Lo vidi in teatro una quindicina di anni fa e | già allora mi 
sembrò da rottamare senza indugio. Oltretutto nacque per la | versione italiana dell'opera, che ha un carattere 
diverso. E' sconcertante | che la Scala abbia deciso di riesumarlo ancora una volta, invece di passare | a qualcosa di 
più moderno e, soprattutto, meno farsesco. Penso che il | vecchiume di questo allestimento possa inficiare la 
migliore delle | esecuzioni musicali. Bene ha fatto la Dessay a lasciare questa produzione al | suo destino. | 

Tav. 7. Il quoting tra due post di it. arti. musica. classica 
(indico con la barra | l'andata a capo e col corsivo il testo quotato). 

Essendo una maestra di ellissi, è ben comprensibile che quest'ordine di fenomeni sia stato (e 
continui ad essere) particolarmente studiato da Carla Marello, ai cui lavori non posso che rinviare 
(cfr. soprattutto Marello 2007). 

5. Problemi. A fianco di molte caratteristiche interessanti, non mancano certo i problemi 
nel maneggiare questo tipo di materiali; problemi che tre anni fa così riassumevo: «(a) peculiarità 
linguistiche mediate dal mezzo (gergo informatico, abbreviazioni, emoticon, ecc.); (b) frequenti 
"sporcature" del testo dovute alla trasmissione (passaggio da charset diversi, ecc.) od alla battitura; 
(e) presenza di spam, post OT ("out of topic") e crossposting; (d) l'abbondanza di testo ripetuto, a 
volte (quando effetto del quoting) testualmente rilevante e quindi "buono", ma comunque sempre 
per statistiche lessicali dannoso» (Barbera 2007a, p. 8). 

Nel corso del tempo (da Casa vecchia 2005 a Barbera - Colombo 2010, giusto per indicare le 
due tappe più salienti) a questi problemi abbiamo trovato rimedi via via migliori, ma una soluzione 
realmente efficace resta per alcuni aspetti ancora di là da venire: le versioni che abbiamo messo 
finora online riescono comunque a funzionare ed a contenere i danni entro l'accettabile, od almeno 
così spero. 

Non voglio qui entrare nei dettagli della struttura e delle funzioni dei filtri di pulizia allestiti, né 
in quello della creazione dell'interfaccia (adeguate informazioni sono comunque ricavabili dalla 
bibliografia), se non per segnalare un paio di caratteristiche (o piuttosto limiti) delle versioni 
attualmente disponibili online particolarmente rilevanti a chi utilizzi questi corpora a fini testuali. Il 
primo è che per consentire un uso tradizionale (cioè statistico-lessicografico) dei corpora, andava 
eliminato il più possibile il testo ripetuto: e così nei corpora standard i testi originari sono stati 
fortemente potati riducendoli ad un solo messaggio per thread (ma alcune versioni "intatte" dei più 
piccoli sono state messe online con la dicitura uncut); il secondo è che nelle versioni "vecchie" 
ancora online non sono marcati i confini di frase, problema comunque che abbiamo recentemente 
risolto (cfr. Barbera - Colombo - Onesti 2008 i.s.), ma non ancora esportato retroattivamente. 
Questi problemi, inoltre, va ricordato, riguardano solo le versioni online; in locale è tutto diverso. 

6. Specifiche. I corpora di newsgroup italiani della suite NUNC attualmente disponibili 
online (home: http://www.bmanuel.org/projects/ng-HOME.html; distribuiti tutti da 
corpora.unito.it), fra corpora generalisti e corpora specialistici di cucina, motori e fotografia digitale, 
ammontano finora a 280.587.779 token (cfr. Barbera 2007, p. 6, Tav. 2), e coprono il traffico 
postato nella prima metà del corrente decennio. 

A questi se ne stanno affiancando altri prodotti per il progetto VALERE che estenderanno la loro 
copertura anche alla seconda metà del decennio. In locale, comunque, tale copertura è già totale. 

6.1 La Usenet italiana. La Usenet italiana cui i NUNC -IT attingono ha delle 

caratteristiche proprie che imprimono uno speciale valore ai corpora italiani, rispetto al panorama 
internazionale, e su cui meriterebbe farne qualche cenno. 

La cosa che più colpisce un esploratore che traguardi per la prima volta il panorama della Usenet 
italiana, è la straordinaria abbondanza e varietà dei suoi panorami. Alla gerarchia geonazionale 
storica, it., che aveva delle procedure per la creazione di newsgroup nuovi troppo rigorose, si 
affiancò ben presto (sul modello degli alt. internazionali) una gerarchia free.it., dopo alcuni 
anni di vita tumultuosa ufficialmente chiusa (che significa che non vengono più creati newsgroup 
nuovi, ma quelli esistenti sono in molti casi attivi ancora oggi) perché troppo anarchica e sostituita 
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da una più tranquilla gerarchia it-alt . A fianco a queste fu presto istituita la gerarchia italia. 
che comprende solo newsgroup di interesse municipale. Ma ancora non basta: le principali ditte di 
servizi di comunicazione hanno spesso creato delle gerarchie autonome, perlopiù a scarsa vitalità, 
dalle storiche agora . , voi . , tin . e tiscali . alla più recente f astweb . ; e su questo modello lo 
stesso hanno fatto alcune organizzazioni private, come la gerarchia scout . Solo la Germania, in 
Europa, si avvicina ad una simile situazione, pur restandone largamente al di sotto. 

La caratteristica, sia pure estrinseca, che ne deriva ai NUNC-IT è quella di una ancora maggiore 
rappresentatività della Umgangssprache nazionale, e quella di una maggiore duttilità alla creazione 
di corpora specifici per usi particolari, che magari non sarebbe stato possibile creare per altre lingue 
europee. 

6.2. Corpora chrjsi. Con tutto il parlare che recentemennte si fa di Web Corpora, gioverà 

ribadire che i NUNC sono corpora nel senso proprio della definizione data in Tav. 1 : «sono quindi 
chiusi, fissati, rielaborati e variamente annotati, non fluttuanti come la rete su cui si fanno ricerche 
estemporanee, ad esempio con Google, o come i cosiddetti Web Corpora, spesso presentati come 
l'ultima frontiera della linguistica dei corpora (cfr. Barbera - Corino - Onesti 2007b, § 1.5 7 
corpora futuribili: Web as a corpus?, pp. 44-45, con bibliografia)» (Barbera - Marello 2008). 

6.3 II gestore CQP. Tutti i corpora NUNC, che siano quelli "vecchi" creati per il FIRB "La 

varietà dei testi" che quelli nuovi, creati per il progetto VALERE, sono gestiti col Corpus 
Workbench (CWB), il software open source creato dell'IMS Stuttgart, basato sul Corpus Query 
Processor (CQP) e sul POS-tagger TreeTagger, anche se interfaccia differenziate sono allo studio. 

Su CQP e CWB la letteratura non manca di certo e posso rimandare a Christ - Schulze 1996, 
Heid 2007, Barbera 2009 1J21 pp. 985-1021, oltre naturalmente alla homepage del software ed alla 
manualistica che vi si può scaricare; per il TreeTagger cfr. Schmid 1994 e la manualistica sul sito. 

7 Attualità dei NUNC. Un dubbio inquietante, a quel che sento, sta serpeggiando e 

prendendo vieppiù piede: che Usenet sia ormai un fenomeno sorpassato, sostituito negli ultimi anni 
dai blog, anche per i settori più tecnici. 

Mi sento di poter smentire abbastanza categoricamente questa leggenda metropolitana: Usenet 
gode di ottima salute, il volume del postato non è affatto minore a quello degli anni passati (fatto 
salvo il picco di metà decennio) 16 , i newsgroup più tecnici non languono affatto, e complessi- 
vamente gli italiani si confermano come la popolazione d'Europa che più usa i newsgroup. 

Le condizioni per cui la lingua dei newsgroup possa fornire quella lingua dell'uso medio, quel 
parlato-scritto, quella Umgangssprache nazionale che, almeno per l'italiano, sulla scorta di Sabatini 
e Nencioni, teorizzavamo in Barbera - Marello 2008, e che sembrava una irragiungibile pantera, 
sulla cui odorosa usta tanti grandi linguisti e storici della lingua si erano mossi senza pure mai 
giungerne alla cattura, sembrano continuare a sussistere e sorridere al futuro della ricerca, invo- 
gliandoci ad estendere la copertura cronologica dei NUNC al presente e quella diatopica all'Europa 
tutta, ed oltre, come si sta effettivamente cercando di fare. 



16 Infatti se verso la metà del primo decennio del secolo (con minori variazioni a seconda dei paesi) si è verificata la 
massima espansione del medium, negli anni successivi vi è stata una generale stabilizzazione su buoni valori medi, con 
consolidamento od addirittura recupero nel volume del postato, specie nelle gerarchie italiane. Se la ripresa è più 
marcatamente visibile nella sommatoria complessiva delle gerarchie nazionali (essendo fortemente aumentati il numero 
di newsgroup attivi), anche in singole gerarchie la curva di consolidamento-recupero è abbastanza chiara; si considerino 
ad esempio i newsgroup campione it .hobby, cucina (2004: 44.3 MB; 2005: 67.2 MB; 2006: 49.6 MB; 2007: 57.6 
MB; 2008: 54.6 MB; 2009: 51.7 MB; 2010: 52.5 MB) e de . ree . fotografie (2004: 92.1 MB; 2005: 84.1 MB; 2006: 
65.5 MB; 2007: 44.5 MB; 2008: 45.6 MB; 2009: 56.4 MB). 
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Il Prete Gianni ed i kitan neri: 
una nota . 



V'era il Bicorne... E gli ultimi che, infanti, 
aveano udito il gran maglio cadere 
su le chiavarde, eran grigi vecchi; 

e non partiva... E i figli lor, giganti 
dagli occhi flammei, dalle lingue nere, 
o nani irsuti dai mobili orecchi, 

erano morti; e d 'ognun d 'essi, i mille 
erano nati, quanti le faville 
da un tizzo: ma il Bicorne era lassù. 

Giovanni Pascoli, Gog e Magog, III, 
in Poemi Conviviali, Bologna, Zanichelli, 1904. 



La cosiddetta leggenda del Prete Gianni 1 è uno dei crocevia culturali tra Oriente ed Occidente 
più interessanti del Medioevo, vero ricchissimo cibreo di ingredienti e spezie orientali e cucina 
occidentale. 

Solitamente la fase più nota del mito, od almeno quella cui più spesso si fa riferimento, è la 
Epistula presbyteris Iohannis Emanueli Romeon gubernatori, che tuttavia, come vedremo, non 
rappresenta la prima creazione della leggenda. Si tratta di un "falso" mediolatino composto 
probabilmente prima del 1 150-1 160 e. e comunque prima del 1 177, popolarissimo e volgarizzato in 
quasi tutte le lingue letterarie dell'occidente medievale, dall' anglo -normanno al russo e 
dall'irlandese all'ebraico: cfr. Zaganelli 1990, che, oltre a riprodurre i testi mediolatino, 
anglonormanno e franciano, fornisce una prima bibliografia (per le edizioni delle diverse versioni 
cfr. pp. 45-49) e Conte 2001 che, nel commentare la novella seconda del Novellino (ispirata dal 
nostro personaggio), ben riferisce la bibliografia precedente. Qui il Prete Gianni è già fuso con 
l'intreccio leggendario delle conquiste indiane di Alessandro Magno (popolarizzate, a partire dal 
romanzo greco dello Pseudo-Callistene noto nella versione latina dell'Arciprete Leone (recte Leo 
archipresbyter Neapolitanus) Historia de preliis Alexandri Magni del 951-969 e da numerosi volga- 
rizzamenti medievali come il Roman d'Alexandre [sec. XII exeunté\ di Alexandre de Paris; 
bibliografia sommaria in Zaganelli 1990, p. 38), della predicazione dell'apostolo Tommaso in 
India (diffusissima grazie agli apocrifi Atti di Tommaso) e della reclusione oltre le porte d'Occi- 
dente delle ferali "tribù di Gog e Magog" (basata parte sulla elaborazione giovannea, Apocalisse 



Questa breve nota è in realtà un exergon da un mio più vasto ed inedito lavoro, Dalla Sogdiana al Liàodòng: intro- 
duzione storica alla scrittura mancese (1997), che ne fu estratto nel 1999 per una occasione triestina. Fu poi pubblicato 
senza tentarne un vero aggiornamento, ma limitandoci appena a pochi ritocchi, in La ricerca della verità, a cura di Piero 
de Gennaro, Torino, Traube - Università degli studi di Torino, 2010 "Facoltà di Lingue e letterature straniere", pp. 293- 
304. Purtroppo tale edizione fu irrimediabilmente sfigurata da una grave serie di errori, che pure furono invano 
ripetutamente segnalati ai redattori, e pertanto resa affatto inservibile; questa ne è una versione finalmente ricorretta. 

Molte, troppe, persone andrebbero a vario titolo ringraziate, vuoi per l'originario progetto, vuoi per il presente 
estratto; ci basti qui ricordare con gratitudine Maurizio Bagatin, Franco Crevatin, Antoniomarco Gennaro, Lea Glarey, 
Adriano Miglioranza e Giovanni Stary. 

1 Sul Prete Gianni, oltre a ZAGANELLI 1990 con bibliografia, a GOSMAN 1982 (ed. critica delle versioni francesi ed 
occitaniche con commento) ed agli studi raccolti in Beckingham 1983 e Beckingham - Hamilton 1996, cfr. Conte 
2001 per la ricezione nella letteratura italiana delle origini, Ullendorff - Beckingham 1982 per gli addentellati 
ebraici, De Rachewiltz 1972 per i legami con le esplorazioni d'Oriente, e Pistarino 1961 per le spedizioni portoghesi 
e la fase africana della leggenda. 
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20.8, della storia di Gog re di Magog di Ezechiele 38-39, e parte sul problema delle tribù perdute di 
Israele: cfr. Anderson 1932), in cui vengono ulteriormente imbastiti tutti i consueti effetti speciali 
dell'immaginario medievale, dai bestiari alla geografia fantastica ed all'etnografia bizzarra. Il regno 
del Prete Gianni vi è ancora collocato in un generico Oriente di fantasia: «in tribus Indiis 
dominatur magnificentia nostra, et transit terra nostra ab ulteriore India, in qua corpus sancti 
Thomae apostoli requiescit, per desertum et progreditur ad solis ortum, et redit per declivum in 
Babilonem desertam iuxta turrim Babel | Ke es treis Yndes dunt vui oiez / avum partut nostre 
baillie; / e dure partut nostre seignurie / de cel Ynde que rei me fist / - ou seint Thomas l'apostre 
gist - / desqu'en la fin de l'Orient»: testo latino, § 12 e versione anglonormanna, vv. 146-151. In 
questo fantomatico regno, il Prete Gianni avrebbe soggette, tra varie popolazioni fantastiche, anche 
le amazzoni (da sempre collegate al mito di Alessandro: cfr. bibliografia in Zaganelli 1990, p. 
211) e le «pessimae generationes» antropofaghe identificate con quelle dell'Apocalisse: cfr. §§ 16- 
17 [interpolazione C]: «nomina quarum sunt haec: Gog et Magog, Amie, Agic, Arenar, Defar, 
Fontineperi, Conei, Samantae, Agrimandi, Salterei, Armei, Anofragei, Annicefelei, Tasbei, Alanei. 
Istas nempe et alias multas generationes Alexander puer magnus, rex Macedonum, conclusit inter 
altissimos montes in partibus aquilonis»; passo, sia detto per inciso, di cui sarà ben memore nel 
poema conviviale Gog e Magog il Pascoli che, da supremo alessandrino, poeta doctissimus qual era, 
riuscirà a fondere in un unico organismo quasi ogni sfaccettatura del complesso oggetto mitico, 
financo la species numismatica di Alessandro: «v'era il Bicorne...» III. 1 . 

In realtà il primo fatto storico alla base della leggenda è probabilmente un resoconto leggendario 
della caduta del sultanato selgiuchide 5 di Persia nel 1141 ad opera dei Qara Q'itay ('khan neri' in 
uiguro). Chi erano costoro? 

I khan storici nascono da un non ben precisato complesso tribale noto alle fonti cinesi 7 fin dal 
IV secolo come abitante la regione dell'alto fiume Liào occidentale. La regione consiste nel bacino 



2 Cioè, medievalmente, l'India, il Medioriente e l'Etiopia; la collocazione indiana dell'Etiopia è comunque attestata fin 
dalla fine del IV secolo in Servio Georg. 11.16 «Indiani omnem piagarti Aethiopiae accepimus»; cfr. CARDONA 1975, p. 
526. 

3 Risalente probabilmente alla volontà politica di Alessandro (cfr. il racconto tradizionale dell'oracolo dell'oasi di Siwa) 

di proclamarsi in Egitto come figlio di Ammone (t* — "T imn, greco 'Afi/iwv, probabilmente Yamànu), appropriandosi 

pertanto delle corna di montone della divinità creatrice (cfr. 1~-« imn 'create': FAULKNER 1962, p. 21; cfr. anche 
Erman - GRAPOW 1971/26-71, 1.83-6) del pantheon egizio. Tale iconografia è, tra l'altro, rinnovata ancora oggi 
dall'emissione, politicamente discutibile, da parte della Repubblica Greca nel 1992 di 100 dracme col profilo cornuto di 
Alessandro sul diritto e la legenda MErAS AAEHANAPOS / BASYAEYS MAKEAONQN. 

4 Per l'identificazione del bicorne con Alessandro Magno non sarà qui il caso di invocare, come fa NAVA 2008 ad 
locum, direttamente il Corano XVHI.83-100 passim (precisamente: 83, 86, 94 e 98) con il suo ó^J^' J^ dù al-qarnayn 
'quello dalle due corna' (personaggio, infatti, tradizionalmente equato ad Alessandro, che pure non è mai menzionato 
esplicitamente). Le leggende innescate dalla raffigurazione numismatica di cui in nota precedente saranno certo 
all'origine anche dei passi coranici in questione (come giustamente dice CREVATIN 2009b, p. 23, che riproduce anche la 
moneta: «la designazione [Du-T-Qarnayn] è a mio avviso derivata da un'errata interpretazione antica dell'iconologia 
monetale ellenistica, nella quale il Macedone in quanto figlio riconosciuto del dio Amon porta appunto le corna del 
dio»; cfr. anche Crevatin 2012, p. 687), ed il poemetto pascoliano discenderà piuttosto dalla discussione indiretta che 
di quei passi fa Graf 1882-3, II. p. 524-525, che costituisce, per esplicita testimonianza dello stesso Pascoli, la sua 
principale fonte diretta. A riprova di ciò, la questione monetaria è posta proprio dallo stesso GRAF 1882-3, IL p. 525 in 
nota, e la manifestazione coranica di Alessandro è, idiosincraticamente, resa come Zul-Carnein dal Graf e (appena più 
parnassianamente) Zul-Karnein dal Pascoli (probabilmente partendo da una pronuncia legata, anziché in pausa, dù l- 
qarnayn, con la diffusa frontalizzazione di -a in -e). 

5 O meglio saljuqide o dei Saljuqidi: propriamente yj l3j*^> banii saljùq. 

6 «The name kitan seems to go back to the 4th century A.D. when several chieftains of the Yu-wen [WG = PY Yùwén: 
¥^C] branch of the Hsien-pi [WG = PY Xidnbéi: l^-^-] had names that may have been related to the tribal name Kitan. 
The Chinese rendering of the name from the 5th century on has consistently been Ch'i-tan [WG = PY Qìdan: ^f}, 
MATTHEWS 1947, p. 72 = M551/1]. In the Orkhon inscriptions (732-5) their name appears as Qitay [propriamente 
Q'itay]» (Franke 1990, 402). La breve esposizione storica fornita è basata soprattutto su Franke 1990, Sabattini - 
Santangelo 1986, pp. 438-441, Fitzgerald 1974, pp. 379-381 e Morgan 1997, pp. 55-58; l'opera di riferimento più 
vasta è tuttavia WlTTFOGEL - JlASHENG 1949. Immotivata mi pare la resa con <kh>, pure assai diffusa, forse dovuta da 
un lato ad imprecisione nella resa diretta del grafema uiguro per la uvulare (correttamente traslitterata <q>), e dall'altro 
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del ramo occidentale del Liàohé 7ÈM (lett. 'fiume (he M) Liào'), lo XTliàohé ÌSÌSM (lett. 'fiume 
Liào occidentale (xT H)' 8 ), con i suoi due tributari, il settentrionale Xllàmùlùnhé HÌÌTKfÉM (noto 
anche come Xar Moron He o Siramuren) ed il meridionale Làohàhé ^BpM. Il nome storico di 
questa zona della Manciuria (Liàodòng ÌK jft), ora compresa principalmente nella Mongolia interna 
(F*3 Wt~Èi Nei Ménggù lett. 'interno della Mongolia') ed in parte nel Liàoning 31 t\ era Sóngmò ^ 
7^ (WG Sung-mo = Y Sung Mwo); corrisponde alla parte settentrionale della ex-regione del Jehol 
(ff&M o per esteso ff&MW PY rèhéshéng = WG Jé-he\o sheng 'provincia (W shéng) del fiume (M 
he) caldo (f^ rè)' ), che era la «summer retreat of the emperors, north of Peking» (Mathews 1947, 
p. 462b = M3095/23). Da questo spazio antropologico i Khan emersero quale entità più individuata 
nel 696 quando si organizzarono in khanato. L'espansione imperiale, con l'evoluzione in senso 
statuale e dinastico del pristino khanato tribale ed elettivo, risale all'inizio del X secolo ed è dovuta 
all'iniziativa del khan Apaoki (872-926; a volte riportato con mediazione sinica 1 come A-pao-chi, 
tipo Wade-Giles, od Abaoji, tipo-plnyln), che, assunto il khanato nel 907 e proclamatosi (916) 
augusto imperatore celeste (^Uffr Tiànhuàngdì), costituì l'impero Khan che nel 947 assunse il 
nome dinastico cinese di Liào ì§. L'impero Liào, che «nel periodo di maggiore espansione [...] si 
estendeva dal Mare del Giappone ai monti Aitai, arrivando a Sud fino allo Hebei [Mib Hébéi]» 
(Sabattini - Santangelo 1986, p. 439), durò fino al 1124, quando gli jurchen (ÌCj| PY nuzhén = 
WG nù-chèn o /itiR PY rùzhén = WG ru-chèn), stanziati ad est dei kitan e dapprima loro vassalli, 
dopo essersi conquistata sempre maggiore autonomia, pervennero alla completa conquista 
dell'impero. 

19 lì 

L'organizzazione etnica e sociale dei kitan era composita e complessa anche prima della sua 
ristrutturazione imperiale: nell'VIII secolo il khanato era incentrato su otto tribù, tra le quali nel IX 

alla confusione creata dalla resa mediata attraverso il cinese, dove il carattere che fu scelto allo scopo, 16, foneticamente 
comprensibile in Medio Cinese quando valeva k lev (cfr. Schuessler 2007, p. 423) con iniziale velare, non lo è più in 
mandarino moderno dove ha assunto valore qì, con iniziale palatale. 

7 Data la natura prevalentemente storico-geografica dei termini cinesi qui riferiti, ne diamo di solito la grafia in caratteri 
non semplificati; per analoghe ragioni accanto al plnyln ormai ufficiale diamo anche la trascrizione Wade-Giles, ancora 
assai diffusa e preferita dagli storici (e più raramemente altre, tradizionali, per le medesime ragioni). Sempre per 
semplicità siamo stati economi nell'indicazione dei toni, che sono stati di norma dati una volta sola (di solito nella 
trascrizione pinyin), e non bissati altrove. 

8 II suo ramo orientale è invece il Dongliàohé jflìSM. 

9 In giapponese MìM è letto Nekka, lett. 'calore (M\ netsu) + fiume (M ka)\ mentre HSMì^ Nekkashó è la 'provincia di 
Nekka' (il carattere ìli sho indica le suddivisioni provinciali cinesi, non le prefetture giapponesi, invece JH kerì). Sono i 
nomi antichi di quel che oggi in giapponese è detto M.4É Shótoku, nell'attuale M^tìè" Kahokushó 'provincia di 
Kahoku'. 

10 Forme basate sul nome imperiale sinizzato IPISI^M'H Yelù (nome del clan di provenienza) Abaoji (nome perso- 
nale), nome postumo ìfiyfoTiEL Liao Taizu. 

11 II nome imperiale Liào, o ~j\& Dà Liào 'Grande Liao', segue l'usanza cinese di conferire allo stato / dinastia un 
nome geografico, nella fattispecie quello del fiume Liào (38?Pj PY Liàohé), culla dei kitan (FRANKE 1990, p. 408). La 
data iniziale dell'impero, invece, oscilla tra il 907 (ascensione di Apaoki al khanato; e.g. Mathews 1947, p. 1173) ed il 
916 (sua autoproclamazione imperiale; e.g. Franke 1990, 401): cfr. Franke 1990, p. 408 e Sabattini - Santangelo 
1986, p. 439. 

12 Della lingua dei kitan, invece, molto si è discusso (cfr. Franke 1969 e 1990, pp. 407-408; Sinor 1963, che esamina 
la bibliografia precedente; e DOERFER 1969, che avanza l'ipotesi che si trattasse di una lingua addirittura non-altaica) 
ma poco si sa, anche se l'opinione oggi prevalente è che fosse fondamentalmente una varietà di antico mongolo 
meridionale: di fatto vi convivono fianco a fianco forme con corrispondenti nelle lingue mongole, termini di plausibile 
origine tungusa, parole di etimologia incondita, ed elementi (soprattutto onomastici) viceversa ben diffusi in àmbito 
turco. Questa situazione certo «reflects to a certain degree the character of the Kitan league as a federation comprising 
several ethnic and linguistic elements» (FRANKE 1990, p. 407), ma è anche causa delle grandi difficoltà incontrate nella 
lettura delle due scripte che sono state impiegate per notarla. Entrambe le scripte, nelle fonti cinesi indicate rispettiva- 
mente come grande e, piccola (^KfìiK'^r- PY qìdàn dàzi vs. i^fj'h^ PY qìdàn xiàozì), furono introdotte quasi con- 
temporaneamente, pur in apparenza non condividendo alcun segno. La prima, creata nel 920, è una scrittura logografica 
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secolo presero il predominio due clan, uno (Jf|3# Yélu = WG Yeh-lu od I-la) etnicamente kitan dal 
quale provenne Apaoki, ed uno (if Xiào = WG Hsiao) di estrazione uigura. In epoca imperiale Liào 
la società kitan fu sinizzata più consistentemente della parallela tanguta (15 Jl xixià) 1 , tanto che «la 
dinastia Liao [Liào] del Kitan - secondo chiosa Fitzgerald 1974, p. 381 - fu sotto ogni rispetto 
una dinastia cinese, e tale certamente appariva ai popoli forestieri. Il nome Catai [Marco Polo e 
Matteo Ricci docent ...], che i popoli europei diedero dapprima alla Cina, è derivato dalla parola 
Kitan [Q'itan], e i russi ancora oggi usano la variante Kitai [Km-aìi] per designare la Cina». 

La maggioranza dei kitan rimase comunque in Manciuria anche dopo il 1124, dove costituì, a 
fianco della cinese, la componente etnica straniera più importante del nuovo impero. Ma alcuni 
kitan si spostarono, invece, ad occidente, in Asia Centrale, fondando il cosiddetto impero Qara 
Q'itay (1124-1211), ossia dei 'kitan neri' 15 , la cui dinastia è conosciuta col titolo cinese di Xlliào 
Ì33t (WG Hsi Liao, Y Xyì Lyau), cioè 'Liào occidentali. Gli Xlliào, infatti, guidati daYelù 16 Dashi 
(MWJk^E: Yeh-lù Ta-shih WG = PY Yélu Dàxì), poi imperatore dal 1125-1 135 17 , giunsero a 
sostituirsi all'impero kharakhanide; in séguito sconfissero, nella leggendaria battaglia di Qatwan 

1 R 

( (òljJai del 1141, anche Sanjar (jn"" 1 ), l'ultimo sultano saljuqide di Persia, e si trovarono così a 
giocare un ruolo fondamentale nella storia iranica e dell'Asia Centrale: cfr. MORGAN 1997, pp. 56- 
57, Franke 1990, pp. 401 e 410-411, Sabattini - Santangelo 1986, p. 440 e Wittfogel - 
JlASHENG 1949, pp. 627-657. 

L'impero Qara Q'itay, tra l'altro, costituì una originale sintesi di elementi turco -persiani (ma non 
ne imitò la forma statuale del dispotismo assoluto, tipica mediorientale; il nestorianesimo e l'islam 
vennero liberamente tollerati, anche se la maggiorana dei kitan rimase buddhista e nessun khaghan 



modellata sulla cinese, di cui adotta/adatta non pochi segni; la seconda, introdotta dallo studioso kitan |fj0J PY Diélà 
dopo il 924-925 è anch'essa modellata sul segnano cinese, ma rispetto alla prima associa ai logogrammi un gran 
numero di sillabogrammi, sia per i suffissi sia per i temi, ed è attestata tanto in forme tanto calligrafiche quanto corsive 
(KARA 1996, pp. 230-235). Le scritture kitan sopravvissero alla caduta della dinastia Liào, anche se non si protrassero 
molto oltre: il loro uso fu, infatti, ufficialmente soppresso per rescritto imperiale nel 1191 (KARA 1996, p. 231), sotto la 
dinastia Jin (le PY Jìn — WG Chin) degli jurchen (per la cui lingua e scrittura cfr. invece Kane 1989). La decifrazione 
di tutte e due le scripte kitan, s'è detto, è ardua, anche in considerazione del non abbondante numero di testi superstiti, 
ma notevoli passi avanti sono stati fatti almeno nella lettura della scrittura piccola, cfr. ClNGGELTEl et alii 1985 e da 
ultimo soprattutto KANE 2009. 

13 Tra le componenti meglio note v'erano almeno kitan, uiguri (in cinese Nife PY Huihé) e coreani Parhae (in cinese 
W)U PY Bóhài = WG Po-hai. 

14 In realtà la denominazione MK (PY xixià — WH hsi-hsia), oggi standard, si impose solo in epoca 7C Yuan; «the 
Tanguts themselves used the Chinese name Da Xia ^JjT. In Tangut they used a name which translates unto Chinese as 
Bai Gao Da Xia Guo ~SMJkM.M (Great state of white and high)» (Wilkinson 2000, pp. 865-866). 

Per storia, società e cultura dell'impero tanguto cfr. KblHAHOB 2008; per la lingua cfr. soprattutto Li 1997. 

15 Secondo il noto codice asiatico di corrispondenze tra colori (nella fattispecie nero) e punti cardinali (nella fattispecie 
ovest); la forma è data in uiguro (la lingua turca che la attesta più anticamente), ma a volte è riferita anche (in un turco 
un po' astratto e semplificato) come karakitan, alla base anche della resa, secondaria, cinese halaqidan tf^WiWzfì 'kitan 
neri'. 

16 Yelù è il nome del clan di provenienza, lo stesso di Apaoki. 

17 Noto col titolo postumo |Z5Ì2I^tk PY Xlliào Dézóng. 

18 Qatwan, secondo la trascrizione al modo arabo più invalsa. 

19 II fattore nestoriano nella creazione della leggenda del Prete Gianni è probabilmente cruciale. Rinunciamo ad 
approfondirlo in questa breve nota solo perché, da un lato, non è ancora sufficientemente studiato e, dall'altro, riteniamo 
che abbisognerebbe di una approfondita indagine monografica, che ci piacerebbe intraprendere in un futuro non troppo 
lontano. In generale, per una storia del fenomeno nestoriano nel suo complesso bisogna ancora affidarsi a VlNE 1937; 
per la diffusione ad oriente, in aree affatto cinesi, si vedano almeno le testimonianze di LEGGE 1888 (e cfr. Saeki 1916 
poi perfezionato in giapponese nel 1935); per la persistenza, invece, della chiesa nestoriana (di lingua siriaca) in Persia 
sono particolarmente interessanti i resoconti di viaggiatori dell'Ottocento, come Perkins 1843 o Bird 1891. 

20 O come la carica suprema 'Gran Khan' di un khanato si voglia rendere: in antico turco xayan o qayan (cfr. GABAIN 
1941, 309a), mongolo classico xayan e xalxa xaan (cfr. LESSING 1960, 906b), jurchen xayan(ni)i (DOERFER 1985, 56), 
manchu han (NORMAN 1978, 124b), cinese nf>f (PY kèhàn = WG k'o-han: cfr. MATTHEWS 1947, 506 = M3381/102) 
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adottò mai l'islamismo), di cultura delle steppe (pur conservando l'allevamento nomadico, i qara- 
q'itay promossero però l'agricoltura stanziale di tradizione persiana), e di civiltà cinese (ma non 
imposero la propria amministrazione centrale al modo cinese, lasciando invece sostanzialmente 
intatte le strutture politiche preesistenti; la monetazione era tuttavia di tipo cinese) che «can be 
described as a separate type of government which may be termed "Central Asian"»: Franke 1990, 
pp. 410-411. 

E sono, crediamo, «alcuni racconti rielaborati del conflitto» tra kitan e kharakhanidi e, 
soprattutto, saljuqidi che, per usare le parole di MORGAN 1997, pp. 56-57 «avevano probabilmente 
dato origine alla leggenda multiforme e resistente del Prete Gianni, stereotipo di un principe che era 
allo stesso tempo sovrano cristiano e capo religioso. Si narra che il Prete Gianni fosse stato 
sollecitato ad aiutare i cristiani torturati in Terra Santa perché considerato il maggiore dei re 
cristiani d'Oriente; è evidente che l'ottimismo dei cristiani avesse indotto a giudicare qualsiasi 
sovrano in guerra con i musulmani, come l'imperatore Khitan, un loro potenziale alleato». Già la 
prima relazione occidentale del fatto, contenuta nel Chronicon (1143-1157) di Ottone di Frisinga 
(recte Otto episcopus Frisingensis, f 1158), attribuisce la vittoria del 1141 contro i «Persarum et 
Medorum reges fratres» ad un certo «Presbyter Johannes» (per le motivazioni del nome, assai 
discusse, cfr. Zaganelli 1990, p. 202), grande «rex et sacerdos» cristiano nestoriano d'estremo 
oriente del quale si sarebbe riferito in un'ambasceria armena fatta nel 1 145 a papa Eugenio III (cfr. 
Gosman 1983). 

Ma la fantastica vicenda non si ferma qui: prima, quando nel 1258 Baghdad e l'ultimo califfato 
abasside cadrà sotto i colpi dei mongoli di Hùlegu, la nuova invasione sarà interpretata come il 
ritorno del Prete Gianni; poi, quando col progredire dell'esplorazione (soprattutto portoghese) 
dell'Oriente gli spazi asiatici erano diventati «ormai patrimonio di esperienza diretta, il regno di 
Gianni si sposta in quelli africani, etiopi più in particolare» (Zaganelli 1990, p. 30 e cfr. pp. 30-31 
e 42-43): l'Etiopia, d'altra parte, era ben la terza India della originaria Lettera. Il cerchio si chiude. 
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